DeepSeek выложил в open source DSpark — компонент, ускоряющий ответы ИИ почти вдвое

2 мин
DeepSeek выложил в open source DSpark — компонент, ускоряющий ответы ИИ почти вдвое

Организация DeepSeek совместно с Пекинским университетом выпустила DSpark — компонент, который ускоряет выдачу ответов нейросети, не меняя саму модель. На боевых серверах превью-версий DeepSeek-V4-Flash и V4-Pro скорость генерации для каждого пользователя выросла до +85%. Исходник и технический отчет организация опубликовала на GitHub.

Техника относится к классу спекулятивного декодирования и ускоряет ответы без потери качества — итоговый текст остается математически идентичным обычной генерации. Прирост измеряли по сравнению с прежнего рабочего варианта под названием MTP-1.

Под капотом — две идеи. Сама модель спекулятивного декодирования устроена так: легкая модель-черновик забегает вперед и быстро набрасывает сразу несколько токенов (слов или их частей), а большая схема проверяет весь блок за один проход — это дешевле, чем генерировать те же токены по одному. Совпавший отрезок с начала блока принимается целиком, и пользователь получает некоторое количество слов за время одного шага. Загвоздка — в качестве черновика: если набрасывать токены блока разом и независимо друг от друга, они плохо стыкуются, и схема легко склеит начало одной фразы с концом иной. Чем дальше от начала блока, тем больше такого брака и тем больше токенов в итоге отвергается. DeepSeek оставил оперативный параллельный черновик, но внедрил к нему крошечный последовательный компонент, который перед каждым следующим токеном оглядывается на уже выбранные. Склейка перестает разваливаться, а скорость черновика почти не страдает.

Вторая идея — не проверять лишнего. Тест блока не бесплатна: под высокой нагрузкой каждый лишний токен занимает в очереди место, которое могло бы достаться другому пользователю, а токены в хвосте блока все равно чаще отвергаются. Поэтому DSpark заранее оценивает для каждого токена шанс пройти проверку, а отдельный планировщик в реальном времени смотрит на загрузку видеокарт: пока ресурсы свободны, он расширяет проверку с прежних двух токенов до пяти-шести, а под пиковой нагрузкой обрезает блок до самых надежных. Так ускорение не оборачивается перегрузкой серверов в час пик.

Одновременно DeepSeek открыл DeepSpec — цельный набор инструментов для обучения таких моделей-черновиков. Внутри сразу три алгоритма, включая DSpark, а равным образом сопровождение чужих моделей — Qwen3 от Alibaba и Gemma от Google. То есть ускорять этим методом можно не только продукты самой DeepSeek, но и сторонние нейросети.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

«Защита США важнее бизнеса»: Хуанг сменил тон по чипам для Китая

57 минут назад

«Защита США важнее бизнеса»: Хуанг сменил тон по чипам для Китая

На годовом собрании акционеров 24 июня глава Nvidia Дженсен Хуанг расставил приоритеты неожиданно жестко: если коммерческая выгода вступает в конфликт с национальной безопасностью США, организация выб

Honda, Nissan и Mitsubishi перейдут на общее ПО и электронные системы для автомобилей

1 час назад

Honda, Nissan и Mitsubishi перейдут на общее ПО и электронные системы для автомобилей

Honda, Nissan и Mitsubishi переходят на общие ПО, комплектующие и электронные системы. Три японских производителя планируют стандартизировать ключевые элементы — прежде всего электронные блоки управле

Тысячи людей в Бразилии, Камбодже и на Филиппинах трудятся над тем, чтобы на Чемпионате мира по футболу работал ИИ

1 час назад

Тысячи людей в Бразилии, Камбодже и на Филиппинах трудятся над тем, чтобы на Чемпионате мира по футболу работал ИИ

В Чемпионате мира по футболу 2026 года ФИФА использует мяч с датчиками, отслеживание в реальном времени, определение офсайдов с помощью искусственного интеллекта, а равным образом ИИ-помощников для ка

OpenAI показала GPT‑5.6 Sol

2 часа назад

OpenAI показала GPT‑5.6 Sol

Помните, мы обсуждали, что Белый дом попросил OpenAI отложить выпуск GPT‑5.6? Так вот — они сделали частичный предварительный доступ. OpenAI официально анонсировала GPT‑5.6 Sol — флагманскую модель но

ИИ помог прочесть сожженный Везувием свиток — текст восстановили буквально из угля

2 часа назад

ИИ помог прочесть сожженный Везувием свиток — текст восстановили буквально из угля

25 июня инициатива Vesuvius Challenge объявил, что впервые прочитал обугленный геркуланумский свиток целиком — от начала до конца и ни разу не развернув его физически. Папирус PHerc. 1667 почти две ты