2 июня 2026, 23:13

Microsoft представила сразу семь новых ИИ-моделей и рассказала, как строит суперинтеллект

3 мин

На конференции Build 2026 подразделение Microsoft AI представило семейство из семи новых моделей под брендом MAI. Среди них — MAI-Thinking-1, первая собственная схема рассуждений компании. Глава направления Мустафа Сулейман подал выпуск как часть более крупной истории: Microsoft строит собственную лабораторию суперинтеллекта — систему, которая, по его словам, должна постоянно улучшаться от цикла к циклу. Название для нее он выбрал образное — "машина восхождения".

Семь моделей закрывают сразу несколько модальностей. Вот они вкратце (детали):

MAI-Thinking-1 — флагманская схема рассуждений среднего размера, 35 млрд активных параметров и контекст на 128 тысяч токенов;
MAI-Code-1-Flash — компактная агентная схема для кодинга на 5 млрд параметров, встроенная в GitHub Copilot и VS Code;
MAI-Image-2.5 (плюс облегченный вариант Flash) — генерация и редактирование изображений, по заявлению Microsoft, выше Nano Banana Pro в рейтинге Arena;
MAI-Transcribe-1.5 — транскрипция речи на 43 языках, в пять раз быстрее конкурентов;
MAI-Voice-2 (и будущая MAI-Voice-2-Flash) — синтез речи на 15 языках с клонированием голоса по короткому образцу.

Главную ставку Microsoft делает не на сами модели, а на то, что с ними можно сделать. Компания представила алгоритм Frontier Tuning: клиент дообучает схема под собственные рабочие процессы прямо в своей среде, на своих данных, через так называемые среды обучения с подкреплением (RLE) — что-то вроде закрытых тренажерных залов для ИИ. По заявлению Microsoft, дообученная под Excel схема сравнялась с GPT-5.4 при эффективности до десяти раз выше, а на корпоративных стандартах McKinsey показала лучший процент побед среди протестированных моделей примерно при десятикратно меньшей цене.

Любопытнее всего то, как Microsoft подает MAI-Thinking-1. Организация заявляет, что в слепых сравнениях схема достигла паритета с Sonnet 4.6 от Anthropic по человеческим предпочтениям — но это про субъективную оценку ответов, а не про тесты. На опубликованных самой Microsoft бенчмарках картина сложнее. В олимпиадной математике схема действительно хороша: на AIME 2025 она набирает 97 баллов, обходя Sonnet 4.6 (95,6) и почти догоняя Opus 4.6 (99,8). Зато в агентном программировании MAI-Thinking-1 заметно уступает большинству флагманов: на Terminal Bench 2.0 (46,0) и SWE-Bench Verified (73,5) у нее одни из худших результатов в таблице, а на SWE-Bench Pro (52,8) она идет вровень разве что с Opus 4.6 (53,4) — который и сам там в аутсайдерах, проигрывая GPT-5.4, Kimi K2.6 и DeepSeek V4. При этом, многие модели в сравнении уже отстают на 1-2 поколения — сейчас доступны GPT-5.5 и Opus 4.8. Пока MAI-Thinking-1 доступна в закрытом превью на платформе Foundry.

Этот принцип — обучение с нуля и без дистилляции — Сулейман подает как ключевую черту всей лаборатории: только лицензированные и чистые данные, собственная архитектура и пайплайн, а равным образом свой чип Maia 200, который уже дает прирост эффективности в 1,4 раза. В тот же день Microsoft анонсировала и совместную с клиникой Mayo разработку отдельной передовой модели для медицины — она будет обучаться на обезличенных клинических данных и останется в собственности клиники. Общую цель компания называет "гуманистическим суперинтеллектом": ИИ должен оставаться инструментом под контролем человека.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Microsoft MAI-Thinking-1

Читают сейчас

12 часов назад

Обзор изменений в законодательстве за июнь 2026 года

В обзоре изменений за июнь 2026 года рассмотрим следующие темы: критическая информационная инфраструктура, финансовые организации, деятельность ФСТЭК России, судебная практика и другие. Читать далее

12 часов назад

«Яндекс» назвал победителей первой премии «Сделано с ИИ»

«Яндекс» подвёл итоги первой премии «Сделано с ИИ», учреждённой для специалистов, которые применяют искусственный интеллект при решении профессиональных задач. Победителями стали разработчики проектов

12 часов назад

Почти 300 репозиториев GitHub использовались для распространения программ-стилеров

На GitHub обнаружили масштабную атаку: 292 репозитория с инфостилерами, которые имитировали известные инструменты в области безопасности, финансов и разработки. По поведению вредонос похож на семейств

12 часов назад

Выпуск ProGate 1.3.0: сопровождение Shardman, отказоустойчивость и улучшения безопасности

Postgres Professional представляет обновление платформы миграции и репликации данных — Postgres ProGate 1.3.0. Ключевые темы релиза: полноценная поддержка Postgres Pro Shardman в качестве приёмника с

12 часов назад

«Авито» планирует запустить свой служба знакомств

«Авито» изучает возможность запуска сервиса знакомств для серьёзных отношений, который будет встроен в основное приложение платформы, рассказали «Ъ» источники, знакомые с планами компании. В «Авито» п