DeepSeek опубликовал V4 — открытую схема с контекстом в миллион токенов

2 мин
DeepSeek опубликовал V4 — открытую схема с контекстом в миллион токенов

Сегодня DeepSeek опубликовали две новые модели: V4-Pro и V4-Flash. Обе работают по архитектуре Mixture-of-Experts, веса доступны на Hugging Face под MIT-лицензией.

V4-Pro содержит 1,6 триллиона параметров. Контекстное окно — один миллион токенов. Одновременно модель потребляет приблизительно 27% вычислений от того, что требовалось предшественнику DeepSeek-V3 при аналогичном контексте.

V4-Flash меньше — 284 миллиарда параметров с 13 активными — и ещё экономичнее: около 10% FLOPs и 7% KV-cache относительно V3. Контекст тот же — миллион токенов.

Обе модели поддерживают три режима рассуждения: Non-think для быстрых задач, Think High и Think Max для сложного планирования. По заявлению разработчиков, Flash в режиме Think Max по ряду задач приближается к Pro.

На агентных кодинг-бенчмарках V4-Pro конкурирует с Claude Opus 4.6 и Sonnet 4.5. На Codeforces рейтинг модели — около 3206. В задачах на знание мира чуть уступает Gemini Pro 3.1.

Цены на api: V4-Flash — $0,14 за миллион входных токенов, V4-Pro — $1,74. Для сравнения, топовые закрытые модели стоят в разы дороже. Есть ночная скидка 50% по пекинскому времени.

Мультимодальность пока отсутствует — сопровождение изображений и видео анонсирована на вторую половину 2026 года. Модели обучены на около 32 триллионах токенов и оптимизированы под чипы Huawei Ascend.

Доступно уже сейчас: чат DeepSeek, OpenRouter, Hugging Face.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Читают сейчас

Порядок в версиях через libs.versions.toml и Bill of Materials

3 минуты назад

Порядок в версиях через libs.versions.toml и Bill of Materials

Продолжаем цикл вебинаров, посвященных современному Gradle для Java-разработчика. Когда версии разбросаны по модулям, один апгрейд библиотеки превращается в ручную правку в десяти местах с риском расс

Dasung представила внешний E-Ink монитор для смартфона Link 2

1 час назад

Dasung представила внешний E-Ink монитор для смартфона Link 2

Китайская Dasung (Dashang Technology) выпустила внешний монитор для смартфона под названием Link 2. Девайс оснащён 6,7-дюймовым монохромным дисплеем на основе электронных чернил с частотой обновления

Представлены победители IOCCC 29 (международного конкурса обфускации кода на языке C)

1 час назад

Представлены победители IOCCC 29 (международного конкурса обфускации кода на языке C)

Состоялся 29-й Международный конкурс обфускации кода на языке C (International Obfuscated C Code Contest, IOCCC, для экспертов и разработчиков Obscure/Obfuscated C program). Организаторы объявили 9 пр

AWS внедряет в своих ЦОД квазислучайную архитектуру на базе отказоустойчивых сетевых графов

1 час назад

AWS внедряет в своих ЦОД квазислучайную архитектуру на базе отказоустойчивых сетевых графов

В AWS описали новое техническое девайс веб архитектуры ЦОД, которую внедряют с конца 2024 года. Она базируется на отказоустойчивых сетевых графах (Resilient Network Graphs, RNG) и уже стала стандартом

Notion восстановила доступ к Anthropic после сбоя в работе ИИ-сервиса

1 час назад

Notion восстановила доступ к Anthropic после сбоя в работе ИИ-сервиса

Notion восстановила доступ к моделям искусственного интеллекта Anthropic после сбоя в своём сервисе Notion AI. Накануне компания предупредила о снижении производительности моделей Opus 4.7 и Opus 4.8,