24 апреля 2026, 09:30
DeepSeek V4 уже доступен бесплатно в чат-приложении — 1М контекста и приличные бенчмарки

DeepSeek выпустила V4 Preview: веса выложены на Hugging Face, платный доступ организован через api, а в веб-чате и приложениях схема можно попробовать бесплатно. В линейку входят две модели на архитектуре "смесь экспертов": DeepSeek-V4-Pro с 1,6 трлн параметров, из которых активируются 49 млрд, и DeepSeek-V4-Flash с 284 млрд параметров и 13 млрд активных. В чате это flash и expert соответственно. Обе версии работают в быстром режиме и режиме глубокого мышления и поддерживают веб-поиск.
Контекстное окно обеих моделей до 1 млн токенов, а в программный интерфейс у них заявлен максимальный вывод до 384K токенов, вызовы инструментов и JSON-вывод. В карточке на Hugging Face веса опубликованы под MIT-лицензией, так что корректнее говорить об открытых весах, а не о целиком открытом процессе обучения. Бенчмарки близки к моделям-лидерам прошлого поколения, вроде Opus 4.6 и GPT-5.4. А вот свежим Opus 4.7 и только что вышедшей GPT-5.5 новинка все-таки уступает:
Технически основной акцент V4 — экономия на длинном контексте. DeepSeek пишет, что при контексте в 1 млн токенов V4-Pro требует только 27% вычислений на новый токен и 10% KV-кеша по сравнению с DeepSeek-V3.2. KV-кеш — это хранилище, где модель хранит промежуточные данные внимания; именно она быстро разрастается на длинных запросах. Следовательно здесь важен не только сам миллион токенов, но и попытка сделать такой режим дешевле в реальной эксплуатации.
Для разработчиков DeepSeek отдельно продвигает V4 как схема для кодинг-агентов. В документации есть инструкция для подключения к Claude Code через Anthropic-совместимый программный оболочку: V4-Pro предлагается использовать как схема уровня Opus/Sonnet, а V4-Flash — как более оперативный и дешевый вариант уровня Haiku. Это не нативная сопровождение Claude Code со стороны Anthropic, а совместимый endpoint, но направление видно: DeepSeek хочет попасть в инструмент, которым пользуются профессионалы по своему миру. А для массового пользователя предлагает бесплатный чат-вариант.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

13 минут назад
Гендиректор Coinbase рассказал, как наращивать использование нейросетей, не раздувая бюджеты на токены
Гендиректор криптобиржи Coinbase Брайан Армстронг поделился стратегией, которая позволяет компании наращивать использование нейросетей без пропорционального роста затрат на токены. Читать далее

21 минуту назад
Anthropic представила Claude Fable 5 и закрытую Mythos 5
Anthropic вывела в публичный доступ Claude Fable 5 — свою самую мощную модель с дополнительными защитными ограничениями, а версию Mythos 5 оставила для проверенных организаций. Разбираемся, что умеют
22 минуты назад
В СПб ФИЦ РАН создали базу данных для оценки концентрации внимания
Учёные Санкт-Петербургского федерального исследовательского центра (СПб ФИЦ) РАН совместно с коллегами из НИУ ВШЭ, РУДН и Университета МИСИС создали открытый набор данных об активности мозга и сердечн
24 минуты назад
PT Application Inspector 6.0: новые возможности обнаружения угроз и повышенная прозрачность
Positive Technologies представила обновленную версию сканера защищенности веб-приложений PT Application Inspector. Теперь продукт определяет, есть ли в исходном коде учетные информация и другая конфид

28 минут назад
GM присоединилась к гонке за разработка батарей для центров обработки данных, использующих ИИ
General Motors представила два новых этапа своей стратегии по завоеванию рынка систем хранения энергии. Самым значительным шагом стало новое партнёрство со стартапом Peak Energy, специализирующимся на