3 часа назад
MiniMax выпустила M3: открытая мультимодальная схема с контекстом 1M токенов

Китайская лаборатория MiniMax представила M3 — открытую мультимодальную схема с контекстным окном до миллиона токенов, ориентированную на программирование и автономные агентные задачи. api и собственная агентная среда MiniMax Code доступны уже сейчас, а веса и технический отчет MiniMax обещает выложить на HuggingFace и GitHub на протяжении примерно десяти дней. Схема обрабатывает текст и изображения как единое целое — мультимодальность, согласно заявлению разработчиков, заложена в нее с самого начала обучения, а не добавлена поверх готовой языковой основы.
На бенчмарках M3 показывает результаты, близкие к топовым закрытым моделям. На SWE-Bench Pro, который проверяет умение решать реальные задачи из GitHub-репозиториев, схема набирает 59,0%, на Terminal Bench 2.1 (выполнение команд в терминале) — 66,0%. Самый заметный результат — на BrowseComp, тесте на автономный веб-поиск и сбор информации: здесь M3 набирает 83,5% и опережает Claude Opus 4.7 с его 79,3%. В наборе агентных и инструментальных бенчмарков вроде MCP Atlas (74,2%) и BankerToolBench (76,1%) M3 идет вровень с лидерами, хотя на части тестов — например, на KernelBench Hard — все еще уступает закрытым конкурентам.
Длинный контекст в M3 обеспечивает собственная архитектура внимания MiniMax Sparse Attention (MSA): api поддерживает окно до 1 миллиона токенов с гарантированным минимумом в 512 тысяч. Такой объем нужен прежде всего для длительных агентных сессий, работы с большими кодовыми базами и анализа длинных видео. Цена одновременно весьма демократичная — 0,60 доллара за миллион входных токенов и 2,40 доллара за миллион выходных в режиме до 512 тысяч; на стандартное использование первые семь дней действует скидка 50%.
В техническом отчете MiniMax приводит некоторое количество примеров работы модели на длинных задачах. В одном из них M3 поручили самостоятельно воспроизвести научную статью с конференции ICLR 2025: модель проработала почти 12 часов без вмешательства человека, сделала 18 коммитов и построила 23 экспериментальных графика, повторив ключевые эксперименты. В другом тесте M3 оптимизировала вычислительное ядро для GPU NVIDIA — за примерно сутки она выполнила 147 итераций и почти две тысячи вызовов инструментов, подняв загрузку оборудования с 7,6% до 71,3%, то есть ускорив работу в 9,4 раза. На бенчмарке PostTrainBench, где схема должна сама обучить другие модели, M3 заняла третье место, уступив только Opus 4.7 и GPT-5.5.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

26 минут назад
Минцифры: за 12 месяцев работы сертификации IT‑специалистов на «Госуслугах» 150 тыс. человек подтвердили свои навыки
1 июня 2026 года Минцифры сообщило, что спустя 12 месяцев после открытия доступа к системе сертификации на «Госуслугах» приблизительно 150 тыс IT‑специалистов прошли тесты и получили сертификаты по ра

29 минут назад
Microsoft представила портативный компьютер Surface Laptop Ultra с процессором Nvidia RTX Spark
В контексте выставки Computex 2026 компания Microsoft презентовала флагманский портативный компьютер Surface Laptop Ultra, оснащённый новым процессором Nvidia RTX Spark — суперчипом для Windows on Arm

1 час назад
NVIDIA представила Nemotron 3 Ultra: открытая 550B-модель, до 5 раз быстрее в своем классе
На кейноуте в Тайбэе 1 июня Дженсен Хуанг представил Nemotron 3 Ultra — старшую схема в открытом семействе Nemotron 3. Это рассуждающая схема приблизительно на 550 млрд параметров (почти как прошлогод

1 час назад
К2Тех и «Аквариус» расширяют партнёрство в области ИТ-инфраструктуры для корпоративного рынка
К2Тех и «Аквариус» планируют масштабировать сотрудничество в проектах по модернизации ИТ-инфраструктуры российских компаний, которым необходимо наращивать вычислительные мощности под растущие бизнес-п

1 час назад
OpenAI решила заняться биологической защитой
OpenAI запустила инструмент для разработки решений в области биологической защиты и готовности к пандемиям. Инициатива OpenAI Rosalind Biodefense Program предложит схема GPT-Rosalind для исследований