1 час назад
Свежий чекпоинт Claude Mythos взламывает защиту электростанции в 3 из 10 попыток

Британский AI Security Institute (AISI) опубликовал отчет о темпах развития кибер-возможностей у передовых моделей. Основной результат: новый внутренний чекпоинт Claude Mythos Preview прошел полигон Cooling Tower — симулятор атаки на промышленную систему управления (industrial control system, ICS) — в 3 из 10 попыток.
Cooling Tower разработан AISI совместно с Hack The Box и имитирует атаку на электростанцию. В кибер-полигонах института предполагается, что начальный доступ к сети атакующий уже получил — проблема модели в том, чтобы развернуть атаку дальше. До нового отчета Cooling Tower не прошла ни одна из протестированных моделей, включая прошлый чекпоинт Mythos Preview и GPT-5.5. AISI прямо отмечает: в начальный раз в их тестировании схема прошла оба кибер-полигона института.
Параллельно AISI прогнал тот же чекпоинт через The Last Ones — 32-шаговую симуляцию взлома корпоративной сети, разработанную с SpecterOps. На эту атаку, по оценке института, человеку-эксперту требуется приблизительно 20 часов работы. Свежий Mythos проходит ее от начала до конца в 6 из 10 попыток. В прошлом отчете тот же Mythos Preview брал The Last Ones в 3 из 10, у GPT-5.5 было 2 из 10. То есть успех почти удвоился между двумя чекпоинтами одной пре-релизной модели за пару месяцев.
AISI меряет так называемый time horizon — длину задач, которые модель решает с надежностью 80%. В ноябре 2025 институт оценивал удвоение этого показателя у передовых моделей в 8 месяцев, к февралю 2026 пересчитал до 4.7 месяцев. Mythos Preview и GPT-5.5 пробивают и эту ускоренную кривую — на графике AISI они выпадают далеко вверх по сравнению с линии тренда. В блоге институт прямо признает, что результаты "существенно превысили даже ускоренный темп" и пока неясно, разовый это всплеск или новая тенденция.
Главное следствие — набор задач AISI близок к насыщению: Mythos и GPT-5.5 решают слишком многое, и точно оценить их реальные возможности становится сложно. Институт готовит более жесткие полигоны и сценарии с активной киберобороной, чтобы тесты лучше отражали реальную обстановку, где атакующему противостоит не пустая сеть, а команда защитников. До этого момента передовые модели бьют любые предельные оценки, которые AISI выставляет, — и каждая следующая итинерация бьет их сильнее предыдущей.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

16 минут назад
Anthropic добавила программный интерфейс-кредит подписчиĸам Claude: $20–200 в месяц на программное использование
С 15 июня 2026 года подписчиĸи Pro, Max и Team получат отдельный ежемесячный ĸредит на программное использование Claude — он не связан с лимитами главный подписĸи. Ознакомиться далее

41 минуту назад
Google представила апдейт Android Auto: переработанный оболочку, мммерсивная навигация, YouTube и Gemini в авто
Google анонсировала крупное апдейт системы Android Auto. Организация показала переработанный оформление, более глубокую интеграцию Google Maps, расширенные возможности Gemini и развлечения, в том с во

1 час назад
Показания Сэма Альтмана в суде «Маск против OpenAI»: что рассказал глава OpenAI
Генеральный директор OpenAI Сэм Альтман выступил перед присяжными по делу «Маск против OpenAI». Топ-менеджер опроверг слова главы Tesla и SpaceX Илона Маска о том, что Альтман и президент OpenAI Грег

1 час назад
Учёные объяснили, почему комары предпочитают одних людей другим
Учёные всё чаще добиваются успехов в расшифровке сложного химического коктейля, который делает некоторых людей более привлекательными для этих переносчиков болезней. «Это не заблуждение — некоторые лю

2 часа назад
27 мая приглашаем на встреча Мастерская Базы Данных в Нижнем Новгороде
В уютной атмосфере и камерном формате наряду с экспертами из ГНИВЦ и Postgres Professional будем разбираться в инструментах, которые делают работу с данными быстрее, надежнее и удобнее. 📅Когда: 27 ма