1 час назад
Microsoft представила сразу семь новых ИИ-моделей и рассказала, как строит суперинтеллект

На конференции Build 2026 подразделение Microsoft AI представило семейство из семи новых моделей под брендом MAI. Среди них — MAI-Thinking-1, первая собственная схема рассуждений компании. Глава направления Мустафа Сулейман подал выпуск как часть более крупной истории: Microsoft строит собственную лабораторию суперинтеллекта — систему, которая, по его словам, должна постоянно улучшаться от цикла к циклу. Название для нее он выбрал образное — "машина восхождения".
Семь моделей закрывают сразу несколько модальностей. Вот они вкратце (детали):
MAI-Thinking-1 — флагманская схема рассуждений среднего размера, 35 млрд активных параметров и контекст на 128 тысяч токенов;
MAI-Code-1-Flash — компактная агентная схема для кодинга на 5 млрд параметров, встроенная в GitHub Copilot и VS Code;
MAI-Image-2.5 (плюс облегченный вариант Flash) — генерация и редактирование изображений, по заявлению Microsoft, выше Nano Banana Pro в рейтинге Arena;
MAI-Transcribe-1.5 — транскрипция речи на 43 языках, в пять раз быстрее конкурентов;
MAI-Voice-2 (и будущая MAI-Voice-2-Flash) — синтез речи на 15 языках с клонированием голоса по короткому образцу.
Главную ставку Microsoft делает не на сами модели, а на то, что с ними можно сделать. Компания представила алгоритм Frontier Tuning: клиент дообучает схема под собственные рабочие процессы прямо в своей среде, на своих данных, через так называемые среды обучения с подкреплением (RLE) — что-то вроде закрытых тренажерных залов для ИИ. По заявлению Microsoft, дообученная под Excel схема сравнялась с GPT-5.4 при эффективности до десяти раз выше, а на корпоративных стандартах McKinsey показала лучший процент побед среди протестированных моделей примерно при десятикратно меньшей цене.
Любопытнее всего то, как Microsoft подает MAI-Thinking-1. Организация заявляет, что в слепых сравнениях схема достигла паритета с Sonnet 4.6 от Anthropic по человеческим предпочтениям — но это про субъективную оценку ответов, а не про тесты. На опубликованных самой Microsoft бенчмарках картина сложнее. В олимпиадной математике схема действительно хороша: на AIME 2025 она набирает 97 баллов, обходя Sonnet 4.6 (95,6) и почти догоняя Opus 4.6 (99,8). Зато в агентном программировании MAI-Thinking-1 заметно уступает большинству флагманов: на Terminal Bench 2.0 (46,0) и SWE-Bench Verified (73,5) у нее одни из худших результатов в таблице, а на SWE-Bench Pro (52,8) она идет вровень разве что с Opus 4.6 (53,4) — который и сам там в аутсайдерах, проигрывая GPT-5.4, Kimi K2.6 и DeepSeek V4. При этом, многие модели в сравнении уже отстают на 1-2 поколения — сейчас доступны GPT-5.5 и Opus 4.8. Пока MAI-Thinking-1 доступна в закрытом превью на платформе Foundry.
Этот принцип — обучение с нуля и без дистилляции — Сулейман подает как ключевую черту всей лаборатории: только лицензированные и чистые данные, собственная архитектура и пайплайн, а равным образом свой чип Maia 200, который уже дает прирост эффективности в 1,4 раза. В тот же день Microsoft анонсировала и совместную с клиникой Mayo разработку отдельной передовой модели для медицины — она будет обучаться на обезличенных клинических данных и останется в собственности клиники. Общую цель компания называет "гуманистическим суперинтеллектом": ИИ должен оставаться инструментом под контролем человека.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

23 минуты назад
OpenAI научила Codex разрабатывать сайты, а равным образом функционировать за банкира, продавца и маркетолога
Компания OpenAI научила Codex собирать интерактивные сайты и приложения по обычному описанию задачи. Новую функцию Sites представили на стриме Intelligence at Work наряду с двумя другими новинками — и

25 минут назад
Prusa представила ColorMix — способ цветной FDM-печати, который даёт возможность послойно смешивать CMYKW-филаменты
Исследователи Prusa Research представили ColorMix — способ печати, который позволяет получать десятки оттенков всего из нескольких базовых филаментов. Метод чередует во время печати тонкие слои цветов

2 часа назад
Минцифры продлило дедлайн переаккредитации ИТ-компаний до 1 июля
Ожидаемо и теперь официально: срок переаккредитации продлили до 1 июля (анкета будет открыта). В 2026 году сроки прохождения плановой процедуры подтверждения ИТ-аккредитации были продлены. Аккредитова

2 часа назад
Zcash экстренно отключила Orchard-пул: дефект, который мог обрушить приватность, нашли первыми
В минувшие выходные команда Zcash обнаружила проблему в самом новом shielded-пуле Orchard. Хорошая новость: дефект нашли до того, как им кто-то воспользовался, и все средства в безопасности. Плохая: O

3 часа назад
США хотят проверять ИИ-модели на киберопасность до релиза: указ Трампа
Президент США Дональд Трамп подписал указ Promoting Advanced Artificial Intelligence Innovation and Security, который вводит добровольную схему раннего доступа государства к самым мощным ИИ-моделям. Ц