Свежий чекпоинт Claude Mythos взламывает защиту электростанции в 3 из 10 попыток

2 мин
Свежий чекпоинт Claude Mythos взламывает защиту электростанции в 3 из 10 попыток

Британский AI Security Institute (AISI) опубликовал отчет о темпах развития кибер-возможностей у передовых моделей. Основной результат: новый внутренний чекпоинт Claude Mythos Preview прошел полигон Cooling Tower — симулятор атаки на промышленную систему управления (industrial control system, ICS) — в 3 из 10 попыток.

Cooling Tower разработан AISI совместно с Hack The Box и имитирует атаку на электростанцию. В кибер-полигонах института предполагается, что начальный доступ к сети атакующий уже получил — проблема модели в том, чтобы развернуть атаку дальше. До нового отчета Cooling Tower не прошла ни одна из протестированных моделей, включая прошлый чекпоинт Mythos Preview и GPT-5.5. AISI прямо отмечает: в начальный раз в их тестировании схема прошла оба кибер-полигона института.

Параллельно AISI прогнал тот же чекпоинт через The Last Ones — 32-шаговую симуляцию взлома корпоративной сети, разработанную с SpecterOps. На эту атаку, по оценке института, человеку-эксперту требуется приблизительно 20 часов работы. Свежий Mythos проходит ее от начала до конца в 6 из 10 попыток. В прошлом отчете тот же Mythos Preview брал The Last Ones в 3 из 10, у GPT-5.5 было 2 из 10. То есть успех почти удвоился между двумя чекпоинтами одной пре-релизной модели за пару месяцев.

AISI меряет так называемый time horizon — длину задач, которые модель решает с надежностью 80%. В ноябре 2025 институт оценивал удвоение этого показателя у передовых моделей в 8 месяцев, к февралю 2026 пересчитал до 4.7 месяцев. Mythos Preview и GPT-5.5 пробивают и эту ускоренную кривую — на графике AISI они выпадают далеко вверх по сравнению с линии тренда. В блоге институт прямо признает, что результаты "существенно превысили даже ускоренный темп" и пока неясно, разовый это всплеск или новая тенденция.

Главное следствие — набор задач AISI близок к насыщению: Mythos и GPT-5.5 решают слишком многое, и точно оценить их реальные возможности становится сложно. Институт готовит более жесткие полигоны и сценарии с активной киберобороной, чтобы тесты лучше отражали реальную обстановку, где атакующему противостоит не пустая сеть, а команда защитников. До этого момента передовые модели бьют любые предельные оценки, которые AISI выставляет, — и каждая следующая итинерация бьет их сильнее предыдущей.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Anthropic добавила программный интерфейс-кредит подписчиĸам Claude: $20–200 в месяц на программное использование

16 минут назад

Anthropic добавила программный интерфейс-кредит подписчиĸам Claude: $20–200 в месяц на программное использование

С 15 июня 2026 года подписчиĸи Pro, Max и Team получат отдельный ежемесячный ĸредит на программное использование Claude — он не связан с лимитами главный подписĸи. Ознакомиться далее

Google представила апдейт Android Auto: переработанный оболочку, мммерсивная навигация, YouTube и Gemini в авто

41 минуту назад

Google представила апдейт Android Auto: переработанный оболочку, мммерсивная навигация, YouTube и Gemini в авто

Google анонсировала крупное апдейт системы Android Auto. Организация показала переработанный оформление, более глубокую интеграцию Google Maps, расширенные возможности Gemini и развлечения, в том с во

Показания Сэма Альтмана в суде «Маск против OpenAI»: что рассказал глава OpenAI

1 час назад

Показания Сэма Альтмана в суде «Маск против OpenAI»: что рассказал глава OpenAI

Генеральный директор OpenAI Сэм Альтман выступил перед присяжными по делу «Маск против OpenAI». Топ-менеджер опроверг слова главы Tesla и SpaceX Илона Маска о том, что Альтман и президент OpenAI Грег

Учёные объяснили, почему комары предпочитают одних людей другим

1 час назад

Учёные объяснили, почему комары предпочитают одних людей другим

Учёные всё чаще добиваются успехов в расшифровке сложного химического коктейля, который делает некоторых людей более привлекательными для этих переносчиков болезней. «Это не заблуждение — некоторые лю

27 мая приглашаем на встреча Мастерская Базы Данных в Нижнем Новгороде

2 часа назад

27 мая приглашаем на встреча Мастерская Базы Данных в Нижнем Новгороде

В уютной атмосфере и камерном формате наряду с экспертами из ГНИВЦ и Postgres Professional будем разбираться в инструментах, которые делают работу с данными быстрее, надежнее и удобнее. 📅Когда: 27 ма