DeepSeek V4 ожидается до конца недели. По слухам, схема будет полностью мультимодальной

2 мин
DeepSeek V4 ожидается до конца недели. По слухам, схема будет полностью мультимодальной

DeepSeek планирует выпустить флагманскую модель V4 на этой неделе — это будет первый большой выпуск компании с января 2025 года, сообщает TechNode со ссылкой на источники, знакомые с ситуацией. По данным Financial Times, V4 станет мультимодальной моделью, способной генерировать текст, изображения и видео. Это неожиданный поворот: последние месяцы все слухи указывали на узкую специализацию в кодинге и агентских возможностях.

Впрочем, мультимодальность не означает отказ от программирования — скорее наоборот. Еще в январе Reuters со ссылкой на The Information сообщал, что внутренние тесты V4 показывают превосходство над Claude и GPT в задачах с кодом, особенно при обработке длинных промптов. Архитектура модели построена на трех важных технологиях: mHC для стабильного масштабирования до триллиона параметров, Engram для эффективного извлечения информации из контекста в миллион токенов и обновленный DeepSeek Sparse Attention. Контекстное окно в 1 млн токенов DeepSeek уже тихо включила в приложении 11 февраля — сообщество расценило это как тест инфраструктуры V4.

Отдельная интрига — в железе. По данным Reuters, DeepSeek впервые не предоставила предрелизную версию модели Nvidia и AMD для оптимизации драйверов, отдав приоритет китайским чипмейкерам Huawei и Cambricon. Одновременно, как сообщал ранее высокопоставленный чиновник администрации Трампа, саму V4 тренировали на чипах Nvidia Blackwell — экспорт которых в Китай запрещен. DeepSeek, Huawei и Cambricon отказались от комментариев.

Тайминг тоже не случаен: релиз приурочен к парламентским заседаниям "Двух сессий", которые стартуют 4 марта. Год назад запуск DeepSeek R1 обвалил акции Nvidia на $600 млрд за день, и аналитики уже оценивают потенциальный эффект V4 на рынки. Впрочем, Nomura Securities считает, что повторения рыночного шока не будет — на этот раз индустрия морально готова.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

После редизайна SharePoint работает на основе ИИ от Anthropic

5 марта 2026 г.

После редизайна SharePoint работает на основе ИИ от Anthropic

SharePoint используется в корпоративных средах для управления контентом и файлами, размещёнными в частных сетях организаций, поэтому каждое апдейт влияет на миллионы клиентов по всему миру. Корпорация

ИИ не может контролировать свои мысли — и это хорошая новость: OpenAI протестировали 13 моделей

5 марта 2026 г.

ИИ не может контролировать свои мысли — и это хорошая новость: OpenAI протестировали 13 моделей

OpenAI опубликовали исследование контролируемости цепочки рассуждений (chain of thought, CoT) у reasoning-моделей — и пришли к парадоксальному выводу: все 13 протестированных моделей плохо справляются

OpenAI представила новую схема GPT-5.4

5 марта 2026 г.

OpenAI представила новую схема GPT-5.4

Компания продолжает развивать линейку языковых моделей, делая упор на более сложные задачи, программирование и работу с инструментами. Новая версия ориентирована не только на диалог, но и на выполнени

OpenAI выпустила GPT-5.4 — свою новую флагманскую схема

5 марта 2026 г.

OpenAI выпустила GPT-5.4 — свою новую флагманскую схема

Главное модификация: схема объединила возможности кодинга из GPT-5.3-Codex с улучшенным рассуждением из GPT-5.2. Раньше это были отдельные модели под разные задачи, теперь одна. На бенчмарке GDPval, г

Вышла GPT-5.4 — первая схема OpenAI, которая управляет компьютером

5 марта 2026 г.

Вышла GPT-5.4 — первая схема OpenAI, которая управляет компьютером

OpenAI выпустила GPT-5.4 — новую flagship-модель, которая заменяет сразу две предшественницы: GPT-5.2 (универсальную) и GPT-5.3-Codex (кодерскую). Контекстное окно выросло до 1,05 млн токенов — в 2,5