MiniMax представили M2.7: обновленную версию свой флагманской модели

2 мин
MiniMax представили M2.7: обновленную версию свой флагманской модели

MiniMax только что выпустили M2.7 — модель, которая отчасти участвовала в собственном обучении.

Во время разработки M2.7 использовалась для построения десятков сложных навыков внутри RL-харнесса, обновления собственной памяти и оптимизации процесса обучения. По сути, схема помогала писать правила, по которым её же и дообучали.

В одном из сценариев исследователь описывает идею эксперимента, агент изучает литературу, отслеживает спецификации, запускает эксперименты, мониторит их, автоматически читает логи, дебажит, анализирует метрики, фиксит исходник и делает мёрджи. Раньше это требовало нескольких человек из разных команд. Сейчас люди подключаются только для критических решений. M2.7 закрывает 30–50% этого процесса.

По бенчмаркам: SWE-Pro — 56.22%, VIBE-Pro — 55.6%, соблюдение инструкций по 40+ сложным навыкам — 97%. На большинстве тестов схема держится рядом с Claude Sonnet 4.6 и Opus 4.6.

Предыдущая релиз, M2.5, была де-факто самой популярной бесплатной моделью в инструментах для разработчиков — OpenCode, Kilo Code, Cline и других. За некоторое количество месяцев M2-серия стала одной из самых используемых на платформе Cline. Теперь интересно, как скоро M2.7 займёт то же место.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Читают сейчас

У чат-бота Grok в X украли $175 тыс. с помощью азбуки Морзе

30 минут назад

У чат-бота Grok в X украли $175 тыс. с помощью азбуки Морзе

4 мая атакующий через адрес ilhamrafli.base.eth вывел из ИИ-кошелька, привязанного к аккаунту Grok в X, приблизительно $175 тысяч в токенах DRB на сети Base. Ни одной строчки эксплойт-кода не понадоби

Только 20% российских компаний имеют фактический план действий на случай аварий в ИТ: исследование Linx Cloud и Global CIO

35 минут назад

Только 20% российских компаний имеют фактический план действий на случай аварий в ИТ: исследование Linx Cloud и Global CIO

Облачный провайдер Linx Cloud совместно с сообществом ИТ-лидеров Global CIO провели исследование отказоустойчивости крупного и среднего российского бизнеса. Цель исследования – понять текущую зрелость

Машинное обучение в реальных условиях: проверьте свои силы на Yandex ML Challenge

45 минут назад

Машинное обучение в реальных условиях: проверьте свои силы на Yandex ML Challenge

21 мая пройдёт Yandex ML Challenge — масштабное соревнование для всех, кто интересуется ML и готов помериться силами в решении разных задач: от работы с LLM до Reinforcement Learning. Участников ждёт

РБК: некоторое количество топ-чиновников Минцифры могут покинуть ведомство на фоне реорганизации

45 минут назад

РБК: некоторое количество топ-чиновников Минцифры могут покинуть ведомство на фоне реорганизации

Заместитель главы Минцифры Сергей Кучушев рассматривает функция ухода из министерства, сейчас чиновник курирует три направления: департамент экономики и финансов, департамент развития IT-отрасли и деп

1 час назад

Минпромторг поддержал введение НДС в 22% на зарубежные интернет-заказы

Минпромторг России поддержал введение с 1 января 2027 года налога на добавленную стоимость (НДС) на иностранные товары, приобретаемые через интернет, в размере 22%, сообщили ТАСС в министерстве. Ознак