24 апреля 2026, 08:49
DeepSeek опубликовал V4 — открытую схема с контекстом в миллион токенов

Сегодня DeepSeek опубликовали две новые модели: V4-Pro и V4-Flash. Обе работают по архитектуре Mixture-of-Experts, веса доступны на Hugging Face под MIT-лицензией.
V4-Pro содержит 1,6 триллиона параметров. Контекстное окно — один миллион токенов. Одновременно модель потребляет приблизительно 27% вычислений от того, что требовалось предшественнику DeepSeek-V3 при аналогичном контексте.
V4-Flash меньше — 284 миллиарда параметров с 13 активными — и ещё экономичнее: около 10% FLOPs и 7% KV-cache относительно V3. Контекст тот же — миллион токенов.
Обе модели поддерживают три режима рассуждения: Non-think для быстрых задач, Think High и Think Max для сложного планирования. По заявлению разработчиков, Flash в режиме Think Max по ряду задач приближается к Pro.

На агентных кодинг-бенчмарках V4-Pro конкурирует с Claude Opus 4.6 и Sonnet 4.5. На Codeforces рейтинг модели — около 3206. В задачах на знание мира чуть уступает Gemini Pro 3.1.
Цены на api: V4-Flash — $0,14 за миллион входных токенов, V4-Pro — $1,74. Для сравнения, топовые закрытые модели стоят в разы дороже. Есть ночная скидка 50% по пекинскому времени.
Мультимодальность пока отсутствует — сопровождение изображений и видео анонсирована на вторую половину 2026 года. Модели обучены на около 32 триллионах токенов и оптимизированы под чипы Huawei Ascend.
Доступно уже сейчас: чат DeepSeek, OpenRouter, Hugging Face.
Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!
Читают сейчас

3 минуты назад
Порядок в версиях через libs.versions.toml и Bill of Materials
Продолжаем цикл вебинаров, посвященных современному Gradle для Java-разработчика. Когда версии разбросаны по модулям, один апгрейд библиотеки превращается в ручную правку в десяти местах с риском расс

1 час назад
Dasung представила внешний E-Ink монитор для смартфона Link 2
Китайская Dasung (Dashang Technology) выпустила внешний монитор для смартфона под названием Link 2. Девайс оснащён 6,7-дюймовым монохромным дисплеем на основе электронных чернил с частотой обновления

1 час назад
Представлены победители IOCCC 29 (международного конкурса обфускации кода на языке C)
Состоялся 29-й Международный конкурс обфускации кода на языке C (International Obfuscated C Code Contest, IOCCC, для экспертов и разработчиков Obscure/Obfuscated C program). Организаторы объявили 9 пр

1 час назад
AWS внедряет в своих ЦОД квазислучайную архитектуру на базе отказоустойчивых сетевых графов
В AWS описали новое техническое девайс веб архитектуры ЦОД, которую внедряют с конца 2024 года. Она базируется на отказоустойчивых сетевых графах (Resilient Network Graphs, RNG) и уже стала стандартом

1 час назад
Notion восстановила доступ к Anthropic после сбоя в работе ИИ-сервиса
Notion восстановила доступ к моделям искусственного интеллекта Anthropic после сбоя в своём сервисе Notion AI. Накануне компания предупредила о снижении производительности моделей Opus 4.7 и Opus 4.8,