10 июня 2026, 18:00

DeepSeek дообучили без Nvidia: 1000 Ascend 910C и 1500 итераций без сбоев

2 мин

Исследовательская команда во главе с Huawei провела полное дообучение (full-parameter post-training) модели DeepSeek V4-Pro на 1,6 трлн параметров, используя кластер минимум из 1000 ускорителей Ascend 910C. Об этом 5 июня сообщило в соцсетях правительство Шэньчжэня, на пост обратила внимание South China Morning Post. По данным команды, прогон занял свыше 1500 итераций обучения и прошел без единого сбоя, а математические способности модели в итоге улучшились.

Вместе с Huawei над проектом работали шэньчжэньский кампус Харбинского политехнического института, Шэньчжэньский институт больших данных и Shenzhen Loop Area Institute. Ключевое слово здесь — "полное": как уточняет Tom's Hardware, при дообучении обновлялись все 1,6 трлн весов модели, а не легкая надстройка-адаптер поверх замороженной основы.

Контраст с недавним прошлым показательный. В августе 2025 года источники Financial Times рассказывали, что DeepSeek не смогла завершить ни одного успешного прогона обучения модели R2 на Ascend — даже с командой инженеров Huawei, работавшей прямо в офисе компании. Тогда жаловались на нестабильную эффективность, медленные интерконнекты между чипами и сырой программный стек CANN, аналог CUDA. Обучение в итоге вернули на Nvidia, а Ascend оставили под инференс (запускание готовой модели). Вышедшая в апреле V4 стала первой моделью DeepSeek, изначально спроектированной под чипы Huawei.

При этом к заявлению стоит относиться осторожно. В отчете нет бенчмарков, длительности прогона, сравнения с той же задачей на оборудовании Nvidia и данных о том, насколько эффективно использовался кластер. Ресурс — официальный канал городских властей, независимых подтверждений пока нет. И важно не путать масштабы: речь о дообучении, а не о предобучении с нуля. Где проходило предобучение V4-Pro, не раскрывается.

Тренировочные мощности — главная зависимость китайской ИИ-отрасли от Nvidia в условиях американских экспортных ограничений. Ascend 910C — нынешний флагман Huawei: двухкристальный ускоритель, который в ранних тестах DeepSeek показывал приблизительно 60% производительности Nvidia H100 на инференсе. Если результат подтвердится независимыми прогонами, следующая планка очевидна — полное предобучение фронтирной модели на китайском железе. За этим и стоит следить.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

deepseek v4 deepseek v4 pro deepseek

Читают сейчас

24 июля 2026, 21:45

Вышел Claude Opus 5 от Anthropic: кодинг, работа с агентами и цены

Anthropic представила Claude Opus 5 — новую версию старшей модели семейства Claude. Схема уже доступна пользователям и через программный интерфейс, а по качеству в ряде задач приблизилась к Claude Fab

24 июля 2026, 20:39

Дженсен Хуанг: ограничения открытых моделей вытолкнут инновации из США

Глава NVIDIA Дженсен Хуанг опубликовал свой начальный пост в X. В нём он поделился совместным открытым письмом в поддержку моделей с открытыми весами. Документ подписали 25 организаций, в том числе NV

24 июля 2026, 20:32

Samsung представила умные очки со встроенным Gemini

Во время презентации Galaxy Unpacked в Лондоне Samsung представила умные очки на базе Android XR. Устройство разработали совместно с Google, а за дизайн отвечали бренды Gentle Monster (Южная Корея) и

24 июля 2026, 20:23

Anthropic выпустили Claude Opus 5: почти Fable 5 за половину цены

Anthropic выпустили Claude Opus 5. Компания позиционирует её как новую основную схема для программирования, длительной работы AI-агентов и профессиональных задач. По заявлению Anthropic, Opus 5 прибли

24 июля 2026, 17:43

Джек Дорси: правительство Индии не любит такие технологии, как Bitchat, и хочет, чтобы его убрали из GitHub

Правительство Индии потребовало от американской платформы GitHub удалить репозиторий Bitchat — открытого проекта децентрализованного мессенджера на базе Bluetooth Low Energy от создателя Twitter Джека