Microsoft натравила 100 ИИ-агентов на Windows и нашла 16 новых уязвимостей

2 мин
Microsoft натравила 100 ИИ-агентов на Windows и нашла 16 новых уязвимостей

Microsoft показала агентную систему поиска уязвимостей под кодовым именем MDASH (multi-model agentic scanning harness — мультимодельная агентная обвязка для сканирования). С ее помощью в майском Patch Tuesday — ежемесячном выпуске обновлений безопасности Microsoft — закрыли 16 новых уязвимостей в сетевом стеке Windows и смежных сервисах. Среди них четыре критических RCE (удаленное выполнение кода): в драйвере tcpip.sys, в службе ikeext.dll и в библиотеках netlogon.dll и dnsapi.dll. Десять из шестнадцати багов сидят в ядре, большинство достижимо из сети без аутентификации.

Главное в MDASH — не одна сильная модель, а оркестрация больше сотни специализированных агентов. Платформа разбита на этапы: подготовка (индексация кода и анализ истории коммитов), сканирование (агенты-аудиторы помечают подозрительные места), валидация (отдельные агенты-оппоненты атакуют и защищают каждую находку), дедупликация и финальный пруф — построение реального триггерного входа, который воспроизводит дефект. Внутри ансамбля работают и тяжелые рассуждающие модели последнего поколения, и более дешевые дистиллированные модели для массовых проходов, и независимая модель-критик.

Цифры, которыми Microsoft подтверждает работоспособность системы:

  • 21 уязвимость из 21 — на закрытом тестовом драйвере StorageDrive, которого нет в обучающих выборках моделей. Ноль ложных срабатываний.

  • 96% полноты на 28 исторических кейсах MSRC (служба реагирования на инциденты Microsoft) за пять лет в драйвере clfs.sys.

  • 100% полноты на 7 исторических кейсах в tcpip.sys за тот же период.

  • 88,45% на публичном бенчмарке CyberGym — 1507 задач воспроизведения реальных уязвимостей из 188 проектов OSS-Fuzz. Это первое место на лидерборде, около на пять пунктов выше прошлого результата.

Как сказал вице-президень по агентной безопасности Тэсу Ким: "Работу делает платформа, а схема — лишь одна из ее деталей". Логика простая: целеуказание, дебаты между агентами, дедуп и пруф не зависят от конкретной модели. Когда выходит новая модель, ее подключают через флаг конфигурации и прогоняют A/B-тест, а накопленная обвязка с плагинами под доменные знания (правила блокировок ядра, внутренние идиомы Windows и так далее) остается. Сейчас MDASH работает внутри Microsoft и доступна узкому кругу клиентов в закрытом превью.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Апдейт Raspberry Pi Connect: теги устройств, экранная клава и обязательная 2FA для организаций

1 час назад

Апдейт Raspberry Pi Connect: теги устройств, экранная клава и обязательная 2FA для организаций

Raspberry Pi выпустила обновление Connect — сервиса удалённого доступа к одноплатникам. Авторы добавили теги для удобной группировки устройств, экранную клавиатуру для работы со смартфона или планшета

Anthropic расширил лимиты подписки Claude и api-кредит для агентов. Но довольны не все

2 часа назад

Anthropic расширил лимиты подписки Claude и api-кредит для агентов. Но довольны не все

13 мая Anthropic заявил сразу две новости для платных подписчиков Claude. Во-первых, недельные лимиты на использование Claude Code выросли на 50% — изменение действует уже сейчас и продержится до 13 и

«Hello Universe»: космическая SoC нового поколения от НАСА начала проходить испытания

3 часа назад

«Hello Universe»: космическая SoC нового поколения от НАСА начала проходить испытания

Инициатива НАСА «Высокопроизводительные вычисления для космических полётов» [High Performance Spaceflight Computing] направлен на радикальное повышение вычислительной мощности космических аппаратов. Д

Anthropic добавила программный интерфейс-кредит подписчиĸам Claude: $20–200 в месяц на программное использование

3 часа назад

Anthropic добавила программный интерфейс-кредит подписчиĸам Claude: $20–200 в месяц на программное использование

С 15 июня 2026 года подписчиĸи Pro, Max и Team получат отдельный ежемесячный ĸредит на программное использование Claude — он не связан с лимитами главный подписĸи. Ознакомиться далее

Google представила апдейт Android Auto: переработанный оболочку, мммерсивная навигация, YouTube и Gemini в авто

4 часа назад

Google представила апдейт Android Auto: переработанный оболочку, мммерсивная навигация, YouTube и Gemini в авто

Google анонсировала крупное апдейт системы Android Auto. Организация показала переработанный оформление, более глубокую интеграцию Google Maps, расширенные возможности Gemini и развлечения, в том с во