DeepSeek опубликовал V4 — открытую схема с контекстом в миллион токенов

2 мин
DeepSeek опубликовал V4 — открытую схема с контекстом в миллион токенов

Сегодня DeepSeek опубликовали две новые модели: V4-Pro и V4-Flash. Обе работают по архитектуре Mixture-of-Experts, веса доступны на Hugging Face под MIT-лицензией.

V4-Pro содержит 1,6 триллиона параметров. Контекстное окно — один миллион токенов. Одновременно модель потребляет приблизительно 27% вычислений от того, что требовалось предшественнику DeepSeek-V3 при аналогичном контексте.

V4-Flash меньше — 284 миллиарда параметров с 13 активными — и ещё экономичнее: около 10% FLOPs и 7% KV-cache относительно V3. Контекст тот же — миллион токенов.

Обе модели поддерживают три режима рассуждения: Non-think для быстрых задач, Think High и Think Max для сложного планирования. По заявлению разработчиков, Flash в режиме Think Max по ряду задач приближается к Pro.

На агентных кодинг-бенчмарках V4-Pro конкурирует с Claude Opus 4.6 и Sonnet 4.5. На Codeforces рейтинг модели — около 3206. В задачах на знание мира чуть уступает Gemini Pro 3.1.

Цены на api: V4-Flash — $0,14 за миллион входных токенов, V4-Pro — $1,74. Для сравнения, топовые закрытые модели стоят в разы дороже. Есть ночная скидка 50% по пекинскому времени.

Мультимодальность пока отсутствует — сопровождение изображений и видео анонсирована на вторую половину 2026 года. Модели обучены на около 32 триллионах токенов и оптимизированы под чипы Huawei Ascend.

Доступно уже сейчас: чат DeepSeek, OpenRouter, Hugging Face.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Читают сейчас

Некоторые пользователи Teams не могут присоединиться к встречам после обновления Edge

28 минут назад

Некоторые пользователи Teams не могут присоединиться к встречам после обновления Edge

Microsoft подтвердила, что недавнее обновление браузера Edge внесло ошибку, которая не позволяет пользователям Windows присоединяться к собраниям Teams. Ознакомиться далее

Инженера Samsung приговорили к семи годам тюрьмы за передачу технологии производства DRAM китайской компании CXMT

43 минуты назад

Инженера Samsung приговорили к семи годам тюрьмы за передачу технологии производства DRAM китайской компании CXMT

Южнокорейский суд приговорил бывшего инженера Samsung к семи годам тюремного заключения по делу об утечке технологии производства 10-нанометровой памяти DRAM. Сотрудник передал производственные информ

DeepSeek V4 уже доступен бесплатно в чат-приложении — 1М контекста и приличные бенчмарки

45 минут назад

DeepSeek V4 уже доступен бесплатно в чат-приложении — 1М контекста и приличные бенчмарки

DeepSeek выпустила V4 Preview: веса выложены на Hugging Face, платный доступ организован через программный интерфейс, а в веб-чате и приложениях модель можно попробовать бесплатно. В линейку входят дв

GitHub Copilot приостановил платные подписки из-за дорогих ИИ-агентов

1 час назад

GitHub Copilot приостановил платные подписки из-за дорогих ИИ-агентов

GitHub приостановил новые регистрации на индивидуальные платные планы Copilot Student, Copilot Pro и Copilot Pro+. Новым пользователям пока остается только Copilot Free, а уже существующие платные под

Ежегодная премия для этичных хакеров Pentest award 2026 снова открывает прием заявок

2 часа назад

Ежегодная премия для этичных хакеров Pentest award 2026 снова открывает прием заявок

Pentest award — это отраслевая награда для пентестеров, которую ежегодно вручает организация Авилликс. Основная задача премии — выделить лучших специалистов и показать их вклад в развитие пентеста. Ив