13 мая 2026, 20:30
Свежий чекпоинт Claude Mythos взламывает защиту электростанции в 3 из 10 попыток

Британский AI Security Institute (AISI) опубликовал отчет о темпах развития кибер-возможностей у передовых моделей. Основной результат: новый внутренний чекпоинт Claude Mythos Preview прошел полигон Cooling Tower — симулятор атаки на промышленную систему управления (industrial control system, ICS) — в 3 из 10 попыток.
Cooling Tower разработан AISI совместно с Hack The Box и имитирует атаку на электростанцию. В кибер-полигонах института предполагается, что начальный доступ к сети атакующий уже получил — проблема модели в том, чтобы развернуть атаку дальше. До нового отчета Cooling Tower не прошла ни одна из протестированных моделей, включая прошлый чекпоинт Mythos Preview и GPT-5.5. AISI прямо отмечает: в начальный раз в их тестировании схема прошла оба кибер-полигона института.
Параллельно AISI прогнал тот же чекпоинт через The Last Ones — 32-шаговую симуляцию взлома корпоративной сети, разработанную с SpecterOps. На эту атаку, по оценке института, человеку-эксперту требуется приблизительно 20 часов работы. Свежий Mythos проходит ее от начала до конца в 6 из 10 попыток. В прошлом отчете тот же Mythos Preview брал The Last Ones в 3 из 10, у GPT-5.5 было 2 из 10. То есть успех почти удвоился между двумя чекпоинтами одной пре-релизной модели за пару месяцев.
AISI меряет так называемый time horizon — длину задач, которые модель решает с надежностью 80%. В ноябре 2025 институт оценивал удвоение этого показателя у передовых моделей в 8 месяцев, к февралю 2026 пересчитал до 4.7 месяцев. Mythos Preview и GPT-5.5 пробивают и эту ускоренную кривую — на графике AISI они выпадают далеко вверх по сравнению с линии тренда. В блоге институт прямо признает, что результаты "существенно превысили даже ускоренный темп" и пока неясно, разовый это всплеск или новая тенденция.
Главное следствие — набор задач AISI близок к насыщению: Mythos и GPT-5.5 решают слишком многое, и точно оценить их реальные возможности становится сложно. Институт готовит более жесткие полигоны и сценарии с активной киберобороной, чтобы тесты лучше отражали реальную обстановку, где атакующему противостоит не пустая сеть, а команда защитников. До этого момента передовые модели бьют любые предельные оценки, которые AISI выставляет, — и каждая следующая итинерация бьет их сильнее предыдущей.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

54 минуты назад
Claude Code за 5 минут вскрыл CAN-шину автомобиля — то, на что у инженера уходят часы
Датская организация CSS Electronics, известный производитель оборудования для работы с автомобильными шинами, показала необычный эксперимент: ее инженер Мартин Фальк собрал скилл для Claude Code, кото

3 часа назад
НАСА: свежий астероид, скорее всего, не встретится ни с нами, ни с Луной
Новые наблюдения, проведённые космическим телескопом НАСА имени Джеймса Уэбба, подтвердили отсутствие угрозы столкновения с астероидом 2024 YR4, исключив вероятность того, что этот приблизительноземны

3 часа назад
Claude Fable 5 могут вернуть уже на следующей неделе — Axios
Администрация Трампа близка к тому, чтобы разрешить Anthropic восстановить доступ к Claude Fable 5 — самой мощной модели компании, которая остается оффлайн уже 15 дней. Об этом сообщил Axios со ссылко

3 часа назад
Samsung столкнулась с иском о нарушении десяти патентов
Компания Samsung столкнулась с патентным троллем: фирма Tau Ceti Ventures подала иск против Samsung в Окружной суд Восточного округа Техаса. Компания утверждает, что Samsung нарушила десять её патенто
4 часа назад
Использование ИИ в преступлениях станет отягчающим обстоятельством
На Петербургском международном юридическом форуме замначальника следственного департамента МВД Данил Филиппов заявил: ведомство поддерживает инициативу Следственного комитета — сделать использование и