24 апреля 2026, 09:30

DeepSeek V4 уже доступен бесплатно в чат-приложении — 1М контекста и приличные бенчмарки

2 мин

DeepSeek выпустила V4 Preview: веса выложены на Hugging Face, платный доступ организован через api, а в веб-чате и приложениях схема можно попробовать бесплатно. В линейку входят две модели на архитектуре "смесь экспертов": DeepSeek-V4-Pro с 1,6 трлн параметров, из которых активируются 49 млрд, и DeepSeek-V4-Flash с 284 млрд параметров и 13 млрд активных. В чате это flash и expert соответственно. Обе версии работают в быстром режиме и режиме глубокого мышления и поддерживают веб-поиск.

Контекстное окно обеих моделей до 1 млн токенов, а в программный интерфейс у них заявлен максимальный вывод до 384K токенов, вызовы инструментов и JSON-вывод. В карточке на Hugging Face веса опубликованы под MIT-лицензией, так что корректнее говорить об открытых весах, а не о целиком открытом процессе обучения. Бенчмарки близки к моделям-лидерам прошлого поколения, вроде Opus 4.6 и GPT-5.4. А вот свежим Opus 4.7 и только что вышедшей GPT-5.5 новинка все-таки уступает:

Технически основной акцент V4 — экономия на длинном контексте. DeepSeek пишет, что при контексте в 1 млн токенов V4-Pro требует только 27% вычислений на новый токен и 10% KV-кеша по сравнению с DeepSeek-V3.2. KV-кеш — это хранилище, где модель хранит промежуточные данные внимания; именно она быстро разрастается на длинных запросах. Следовательно здесь важен не только сам миллион токенов, но и попытка сделать такой режим дешевле в реальной эксплуатации.

Для разработчиков DeepSeek отдельно продвигает V4 как схема для кодинг-агентов. В документации есть инструкция для подключения к Claude Code через Anthropic-совместимый программный оболочку: V4-Pro предлагается использовать как схема уровня Opus/Sonnet, а V4-Flash — как более оперативный и дешевый вариант уровня Haiku. Это не нативная сопровождение Claude Code со стороны Anthropic, а совместимый endpoint, но направление видно: DeepSeek хочет попасть в инструмент, которым пользуются профессионалы по своему миру. А для массового пользователя предлагает бесплатный чат-вариант.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

DeepSeek DeepSeek v4 deepseek r2

Читают сейчас

20 часов назад

Вышел Claude Opus 5 от Anthropic: кодинг, работа с агентами и цены

Anthropic представила Claude Opus 5 — новую версию старшей модели семейства Claude. Схема уже доступна пользователям и через программный интерфейс, а по качеству в ряде задач приблизилась к Claude Fab

21 час назад

Дженсен Хуанг: ограничения открытых моделей вытолкнут инновации из США

Глава NVIDIA Дженсен Хуанг опубликовал свой начальный пост в X. В нём он поделился совместным открытым письмом в поддержку моделей с открытыми весами. Документ подписали 25 организаций, в том числе NV

21 час назад

Samsung представила умные очки со встроенным Gemini

Во время презентации Galaxy Unpacked в Лондоне Samsung представила умные очки на базе Android XR. Устройство разработали совместно с Google, а за дизайн отвечали бренды Gentle Monster (Южная Корея) и

21 час назад

Anthropic выпустили Claude Opus 5: почти Fable 5 за половину цены

Anthropic выпустили Claude Opus 5. Компания позиционирует её как новую основную схема для программирования, длительной работы AI-агентов и профессиональных задач. По заявлению Anthropic, Opus 5 прибли

24 июля 2026, 17:43

Джек Дорси: правительство Индии не любит такие технологии, как Bitchat, и хочет, чтобы его убрали из GitHub

Правительство Индии потребовало от американской платформы GitHub удалить репозиторий Bitchat — открытого проекта децентрализованного мессенджера на базе Bluetooth Low Energy от создателя Twitter Джека