DeepSeek в 10 раз снизила цену на кэш

1 мин
DeepSeek в 10 раз снизила цену на кэш

DeepSeek резко удешевила один из самых чувствительных элементов программный интерфейс - кэш. Теперь повторные запросы (cache hits) стоят всего 10% от прежней цены по всей линейке моделей.

Что это значит на практике?

Любой повторно используемый контекст:

1) Системные промпты

2) Инструкции агентов

3) История диалога

4) Длинные документация в RAG

Теперь обходится почти бесплатно. Раньше именно это съедало бюджет при работе с LLM, особенно в сложных пайплайнах.

Почему это важно? Для агентных систем и RAG-подходов это фактически смена правил игры. Вы можете держать крупный контекст без постоянного страха за стоимость.

DeepSeek делает ставку на то, что будущее за длинными контекстами и многошаговыми агентами, где повторное использование данных - норма, а не удаление.

Вспомогательный бонус - скидка до 75% на V4-Pro всё ещё действует. В связке с дешёвым кэшем это даёт одну из самых агрессивных ценовых моделей на рынке!

Читают сейчас

Грабитель в США решил оспорить обвинительный приговор на основании данных о местоположении своего мобильного телефона

22 минуты назад

Грабитель в США решил оспорить обвинительный приговор на основании данных о местоположении своего мобильного телефона

Американец Окелло Чатри ограбил банк в пригороде города Ричмонд, штат Виргиния, и скрылся со $195 тыс., но его нашли при помощи системы сбора данных о местоположении пользователей мобильных телефонов

Luxms BI получила сертификат ФСТЭК России по 4 уровню доверия

33 минуты назад

Luxms BI получила сертификат ФСТЭК России по 4 уровню доверия

Luxms BI получила сертификат ФСТЭК России по 4 уровню доверия. Это означает, что система прошла проверку на соответствие требованиям по защите информации и может использоваться в системах, где защита

«Т‑банк» запустил оплату на iPhone без подключения к интернету через служба T‑Pay

33 минуты назад

«Т‑банк» запустил оплату на iPhone без подключения к интернету через служба T‑Pay

«Т‑банк» запустил возможность бесконтактной оплаты для пользователей iPhone без подключения к интернету через служба T‑Pay, сообщила пресс‑служба банка. С помощью сервиса T‑Pay на iPhone можно соверши

Апдейт Алисы AI: функция поделиться чатом, умные подсказки и режим микрофона

37 минут назад

Апдейт Алисы AI: функция поделиться чатом, умные подсказки и режим микрофона

Пресс-служба Яндекса рассказала про апрельское обновление Алисы AI. Авторы добавили функция делиться чатом и формировать запросы в чате голосом. Кроме того, в диалогах теперь есть подсказки, а в прило

Российские исследователи разработали модели для перевода устных математических формул в LaTeX

42 минуты назад

Российские исследователи разработали модели для перевода устных математических формул в LaTeX

Исследователи из AIRI, Иннополиса, МТУСИ, НИУ ВШЭ и МГУ представили открытый датасет и набор решений для задачи Speech-to-LaTeX — перевода надиктованных математических формул в структурированную запис