DeepSeek в 10 раз снизила цену на кэш

1 мин
DeepSeek в 10 раз снизила цену на кэш

DeepSeek резко удешевила один из самых чувствительных элементов api - кэш. Теперь повторные запросы (cache hits) стоят всего 10% от прежней цены по всей линейке моделей.

Что это значит на практике?

Любой повторно используемый контекст:

1) Системные промпты

2) Инструкции агентов

3) История диалога

4) Длинные документы в RAG

Теперь обходится почти бесплатно. Раньше именно это съедало бюджет при работе с LLM, особенно в сложных пайплайнах.

Почему это важно? Для агентных систем и RAG-подходов это практически смена правил игры. Вы можете держать крупный контекст без постоянного страха за стоимость.

DeepSeek делает ставку на то, что будущее за длинными контекстами и многошаговыми агентами, где повторное использование данных - норма, а не исключение.

Вспомогательный бонус - скидка до 75% на V4-Pro всё ещё действует. В связке с дешёвым кэшем это даёт одну из самых агрессивных ценовых моделей на рынке!

Читают сейчас

«Большую четвёрку» операторов обязали обеспечить покрытие в более чем 150 малых населённых пунктах

34 минуты назад

«Большую четвёрку» операторов обязали обеспечить покрытие в более чем 150 малых населённых пунктах

Государственная комиссия по радиочастотам (ГКРЧ) обязала «Вымпелком», «МегаФон», МТС и Т2 обеспечить покрытие в свыше 150 населённых пунктах с населением от 1 тыс. человек до 31 марта 2027 года, следу

Как корпорация ITG масштабировала сервисную схема на всю компанию

38 минут назад

Как корпорация ITG масштабировала сервисную схема на всю компанию

Быстрый рост корпорации ITG повлиял на управляемость сервисов, необходимо было стандартизировать процессы, повысить прозрачность и организовать единую точку входа для всех обращений сотрудников. Подхо

Google изучает атаки с внедрением подсказок против ИИ-агентов

58 минут назад

Google изучает атаки с внедрением подсказок против ИИ-агентов

В Google команды по анализу угроз изучают опасности, связанные с внедрением косвенной подсказки (IPI) для компрометации агентов ИИ, просматривающих веб-страницы. Они провели масштабное исследование об

Исследование Cloud Native-технологий в России: пройдите опрос и помогите отследить тренды и развитие индустрии

1 час назад

Исследование Cloud Native-технологий в России: пройдите опрос и помогите отследить тренды и развитие индустрии

«Флант» в составе Ассоциации облачно-ориентированных технологий проводит исследование о том, как российские команды применяют искусственный интеллект и Cloud Native-технологии в разработке и DevOps. П

Anthropic объяснила снижение качества в Claude Code

1 час назад

Anthropic объяснила снижение качества в Claude Code

Организация разобрала, почему в марте–апреле пользователи заметили деградацию Claude Code, а также Agent SDK и Cowork. Причина оказалась не в одной ошибке, а в наложении сразу трёх изменений. Что пошл