3 марта 2026, 15:53

DeepSeek V4 ожидается до конца недели. По слухам, схема будет полностью мультимодальной

2 мин

DeepSeek планирует выпустить флагманскую модель V4 на этой неделе — это будет первый большой выпуск компании с января 2025 года, сообщает TechNode со ссылкой на источники, знакомые с ситуацией. По данным Financial Times, V4 станет мультимодальной моделью, способной генерировать текст, изображения и видео. Это неожиданный поворот: последние месяцы все слухи указывали на узкую специализацию в кодинге и агентских возможностях.

Впрочем, мультимодальность не означает отказ от программирования — скорее наоборот. Еще в январе Reuters со ссылкой на The Information сообщал, что внутренние тесты V4 показывают превосходство над Claude и GPT в задачах с кодом, особенно при обработке длинных промптов. Архитектура модели построена на трех важных технологиях: mHC для стабильного масштабирования до триллиона параметров, Engram для эффективного извлечения информации из контекста в миллион токенов и обновленный DeepSeek Sparse Attention. Контекстное окно в 1 млн токенов DeepSeek уже тихо включила в приложении 11 февраля — сообщество расценило это как тест инфраструктуры V4.

Отдельная интрига — в железе. По данным Reuters, DeepSeek впервые не предоставила предрелизную версию модели Nvidia и AMD для оптимизации драйверов, отдав приоритет китайским чипмейкерам Huawei и Cambricon. Одновременно, как сообщал ранее высокопоставленный чиновник администрации Трампа, саму V4 тренировали на чипах Nvidia Blackwell — экспорт которых в Китай запрещен. DeepSeek, Huawei и Cambricon отказались от комментариев.

Тайминг тоже не случаен: релиз приурочен к парламентским заседаниям "Двух сессий", которые стартуют 4 марта. Год назад запуск DeepSeek R1 обвалил акции Nvidia на $600 млрд за день, и аналитики уже оценивают потенциальный эффект V4 на рынки. Впрочем, Nomura Securities считает, что повторения рыночного шока не будет — на этот раз индустрия морально готова.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

DeepSeek deepseek v4 deepseek r2

Читают сейчас

17 июля 2026, 13:04

Обзор изменений в законодательстве за июнь 2026 года

В обзоре изменений за июнь 2026 года рассмотрим следующие темы: критическая информационная инфраструктура, финансовые организации, деятельность ФСТЭК России, судебная практика и другие. Читать далее

17 июля 2026, 13:00

«Яндекс» назвал победителей первой премии «Сделано с ИИ»

«Яндекс» подвёл итоги первой премии «Сделано с ИИ», учреждённой для специалистов, которые применяют искусственный интеллект при решении профессиональных задач. Победителями стали разработчики проектов

17 июля 2026, 12:58

Почти 300 репозиториев GitHub использовались для распространения программ-стилеров

На GitHub обнаружили масштабную атаку: 292 репозитория с инфостилерами, которые имитировали известные инструменты в области безопасности, финансов и разработки. По поведению вредонос похож на семейств

17 июля 2026, 12:57

Выпуск ProGate 1.3.0: сопровождение Shardman, отказоустойчивость и улучшения безопасности

Postgres Professional представляет обновление платформы миграции и репликации данных — Postgres ProGate 1.3.0. Ключевые темы релиза: полноценная поддержка Postgres Pro Shardman в качестве приёмника с

17 июля 2026, 12:22

«Авито» планирует запустить свой служба знакомств

«Авито» изучает возможность запуска сервиса знакомств для серьёзных отношений, который будет встроен в основное приложение платформы, рассказали «Ъ» источники, знакомые с планами компании. В «Авито» п