MiniMax представила M2.7 — схема, которая участвовала в собственной разработке

1 мин
MiniMax представила M2.7 — схема, которая участвовала в собственной разработке

Китайская компания MiniMax выпустила схема M2.7, главной особенностью которой стало участие самой модели в процессе собственной эволюции. По заявлению разработчиков, M2.7 - первая схема серии, которая активно помогала строить инфраструктуру для своего обучения: создавала навыки для RL-пайплайнов, обновляла собственную хранилище, оптимизировала процесс обучения с подкреплением и итерировала над архитектурой рабочего окружения.

В области программирования M2.7 разработчики заявляют результаты уровня топовых моделей. На бенчмарке SWE-Pro модель набрала 56.22 процентов, вплотную приблизившись к Claude Opus 4.6.

Отдельно обращают внимание на улучшения по бенчмаркам, оценивающим верхнеуровневое понимание кода и общей логики на уровне проекта в целом: Terminal Bench 2 (57.0%), NL2Repo (39.8%)

Равным образом релиз описывает усовершенствование в других областях:

  • Офисные и профессиональные задачи

  • Машинное обучение

  • Агентский фнукционал

В этом же релизе объявлено (вероятно, в начальный раз?) о выпуске фреймворка OpenRoom - интерактивного визуального пространства для взаимодействия с AI-агентами и инструментами.

Предыдущая релиз модели (M2.5) на сегодня является самой популярной на OpenRouter. Цена новой модели осталась практически аналогичный.

https://openrouter.ai/models?order=most-popular

Читают сейчас

У чат-бота Grok в X украли $175 тыс. с помощью азбуки Морзе

30 минут назад

У чат-бота Grok в X украли $175 тыс. с помощью азбуки Морзе

4 мая атакующий через адрес ilhamrafli.base.eth вывел из ИИ-кошелька, привязанного к аккаунту Grok в X, приблизительно $175 тысяч в токенах DRB на сети Base. Ни одной строчки эксплойт-кода не понадоби

Только 20% российских компаний имеют фактический план действий на случай аварий в ИТ: исследование Linx Cloud и Global CIO

35 минут назад

Только 20% российских компаний имеют фактический план действий на случай аварий в ИТ: исследование Linx Cloud и Global CIO

Облачный провайдер Linx Cloud совместно с сообществом ИТ-лидеров Global CIO провели исследование отказоустойчивости крупного и среднего российского бизнеса. Цель исследования – понять текущую зрелость

Машинное обучение в реальных условиях: проверьте свои силы на Yandex ML Challenge

45 минут назад

Машинное обучение в реальных условиях: проверьте свои силы на Yandex ML Challenge

21 мая пройдёт Yandex ML Challenge — масштабное соревнование для всех, кто интересуется ML и готов помериться силами в решении разных задач: от работы с LLM до Reinforcement Learning. Участников ждёт

РБК: некоторое количество топ-чиновников Минцифры могут покинуть ведомство на фоне реорганизации

46 минут назад

РБК: некоторое количество топ-чиновников Минцифры могут покинуть ведомство на фоне реорганизации

Заместитель главы Минцифры Сергей Кучушев рассматривает функция ухода из министерства, сейчас чиновник курирует три направления: департамент экономики и финансов, департамент развития IT-отрасли и деп

1 час назад

Минпромторг поддержал введение НДС в 22% на зарубежные интернет-заказы

Минпромторг России поддержал введение с 1 января 2027 года налога на добавленную стоимость (НДС) на иностранные товары, приобретаемые через интернет, в размере 22%, сообщили ТАСС в министерстве. Ознак