26 февраля 2026, 17:59
Inception Labs представляет диффузионную языковую модель Mercury 2

Американский стартап-компания Inception представил Mercury 2 — первую языковую модель, использующую диффузионную архитектуру вместо традиционной авторегрессии, что даёт возможность ей генерировать текст в пять раз быстрее существующих аналогов.
Вместо последовательного предсказания токенов схема создает черновой ответ полностью и итеративно его улучшает — аналогичным способом работают генераторы видео и картинок. В результате Mercury 2 достигает скорости более чем 1000 токенов в секунду, при этом качество сопоставимо с Claude 4.5 Haiku и GPT-5.2 Mini.
Сегодня почти все языковые модели, включая решения от OpenAI, Anthropic и Google DeepMind, работают на основе авторегрессивной архитектуры — они генерируют текст последовательно, токен за токеном. Такой решение ограничивает скорость: чем глубже рассуждение, тем выше задержка и затраты.
В ответ на это индустрия инвестировала миллиарды долларов в чипы-ускорители, оптимизацию инфраструктуры и сжатие моделей, тем не менее сам принцип последовательной генерации оставался неизменным.
Mercury 2 предлагает альтернативу — архитектуру, основанную на диффузии. Вместо пошагового предсказания следующего токена схема формирует черновой вариант ответа целиком, а затем итеративно уточняет его, обрабатывая много токенов параллельно. Такой решение, ранее применявшийся преимущественно в генерации изображений и видео, даёт возможность радикально повысить пропускную способность без необходимости полагаться исключительно на аппаратную оптимизацию.
По данным компании, Mercury 2 достигает скорости свыше 1000 токенов в секунду на графических процессорах NVIDIA Blackwell и одновременно показывает качество, сопоставимое с Claude 4.5 Haiku и GPT-5.2 Mini. Модель поддерживает контекстное окно объёмом до 128 000 токенов.
В стандартных бенчмарках она получила 91,1 балла на AIME 2025 и конкурентные результаты в задачах по программированию, научных вычислениях и логическом анализе. Стоимость вывода заявлена на уровне $0,25 за миллион входных токенов и $0,75 за миллион выходных.
Ключевое преимущество подхода — не только скорость, но и устойчивость вывода. Благодаря итеративному уточнению модель способна корректировать ошибки в процессе генерации, формировать структурированные ответы в формате JSON и более предсказуемо работать в агентных системах. Это особенно важно для многошаговых рабочих процессов, где задержка на каждом этапе накапливается и влияет на итоговый пользовательский опыт.
В компании подчеркивают, что Mercury 2 уже ориентирована на промышленное применение: от интерактивного программирования и голосовых интерфейсов до RAG-конвейеров и корпоративной автоматизации.
МСхема совместима с программный оболочка OpenAI, что даёт возможность интегрировать её в существующие стеки без серьезной переработки инфраструктуры. Среди первых партнеров и инвесторов проекта — Menlo Ventures, Mayfield, M12 и ряд технологических фондов, а поддержку в инфраструктуре обеспечивает NVIDIA.
Mercury 2 уже доступна через программный интерфейс компании, и Inception активно привлекает партнеров для масштабного внедрения. Если заявленные показатели подтвердятся на практике, диффузионная архитектура может стать новым этапом эволюции языковых моделей — не за счет наращивания вычислительной мощности, а благодаря смене самого принципа генерации.
Читают сейчас

54 минуты назад
Представлен публике публичный инициатива CSVMusic для преобразования плейлистов из музыкальных сервисов в файлы с набором тегов
Состоялся выпуск открытого проекта под названием CSVMusic. Это подход для преобразования плейлистов из музыкальных сервисов в аудиофайлы с полным набором тегов. Исходный исходник проекта написан на Py

1 час назад
Версия LibreSSL 4.3.0
18 апреля 2026 года состоялся выпуск криптографической библиотеки LibreSSL 4.3.0 (форка OpenSSL, который с 2014 года разрабатывается сообществом отдельно с целью модернизации кодовой базы, повышения б

7 часов назад
xAI включает гиперскорость: Grok 4.3 уже в бете, 4.4 и 4.5 на подходе
17 апреля xAI тихо выкатила Grok 4.3 в ранний бета-доступ, а днем позже Илон Маск опубликовал план дальнейших релизов: до конца мая размер модели вырастет втрое — с 0,5 до 1,5 триллиона параметров. Пр

10 часов назад
Заключительный этап Всероссийской олимпиады школьников по математике проходит в Москве
В Москве стартовал заключительный этап Всероссийской олимпиады школьников по математике. Ивент проходит на площадке Центрального университета и продлится до 20 апреля 2026 года. Всероссийская олимпиад

10 часов назад
Робот пробежал полумарафон быстрее человека-рекордсмена
Гуманоидный робот, победивший в воскресенье в Пекине полумарафон среди роботов, пробежал дистанцию быстрее человека-рекордсмена. Победитель от китайского производителя смартфонов Honor преодолел диста