Свежий чекпоинт Claude Mythos взламывает защиту электростанции в 3 из 10 попыток

2 мин
Свежий чекпоинт Claude Mythos взламывает защиту электростанции в 3 из 10 попыток

Британский AI Security Institute (AISI) опубликовал отчет о темпах развития кибер-возможностей у передовых моделей. Основной результат: новый внутренний чекпоинт Claude Mythos Preview прошел полигон Cooling Tower — симулятор атаки на промышленную систему управления (industrial control system, ICS) — в 3 из 10 попыток.

Cooling Tower разработан AISI совместно с Hack The Box и имитирует атаку на электростанцию. В кибер-полигонах института предполагается, что начальный доступ к сети атакующий уже получил — проблема модели в том, чтобы развернуть атаку дальше. До нового отчета Cooling Tower не прошла ни одна из протестированных моделей, включая прошлый чекпоинт Mythos Preview и GPT-5.5. AISI прямо отмечает: в начальный раз в их тестировании схема прошла оба кибер-полигона института.

Параллельно AISI прогнал тот же чекпоинт через The Last Ones — 32-шаговую симуляцию взлома корпоративной сети, разработанную с SpecterOps. На эту атаку, по оценке института, человеку-эксперту требуется приблизительно 20 часов работы. Свежий Mythos проходит ее от начала до конца в 6 из 10 попыток. В прошлом отчете тот же Mythos Preview брал The Last Ones в 3 из 10, у GPT-5.5 было 2 из 10. То есть успех почти удвоился между двумя чекпоинтами одной пре-релизной модели за пару месяцев.

AISI меряет так называемый time horizon — длину задач, которые модель решает с надежностью 80%. В ноябре 2025 институт оценивал удвоение этого показателя у передовых моделей в 8 месяцев, к февралю 2026 пересчитал до 4.7 месяцев. Mythos Preview и GPT-5.5 пробивают и эту ускоренную кривую — на графике AISI они выпадают далеко вверх по сравнению с линии тренда. В блоге институт прямо признает, что результаты "существенно превысили даже ускоренный темп" и пока неясно, разовый это всплеск или новая тенденция.

Главное следствие — набор задач AISI близок к насыщению: Mythos и GPT-5.5 решают слишком многое, и точно оценить их реальные возможности становится сложно. Институт готовит более жесткие полигоны и сценарии с активной киберобороной, чтобы тесты лучше отражали реальную обстановку, где атакующему противостоит не пустая сеть, а команда защитников. До этого момента передовые модели бьют любые предельные оценки, которые AISI выставляет, — и каждая следующая итинерация бьет их сильнее предыдущей.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Claude Code за 5 минут вскрыл CAN-шину автомобиля — то, на что у инженера уходят часы

54 минуты назад

Claude Code за 5 минут вскрыл CAN-шину автомобиля — то, на что у инженера уходят часы

Датская организация CSS Electronics, известный производитель оборудования для работы с автомобильными шинами, показала необычный эксперимент: ее инженер Мартин Фальк собрал скилл для Claude Code, кото

НАСА: свежий астероид, скорее всего, не встретится ни с нами, ни с Луной

3 часа назад

НАСА: свежий астероид, скорее всего, не встретится ни с нами, ни с Луной

Новые наблюдения, проведённые космическим телескопом НАСА имени Джеймса Уэбба, подтвердили отсутствие угрозы столкновения с астероидом 2024 YR4, исключив вероятность того, что этот приблизительноземны

Claude Fable 5 могут вернуть уже на следующей неделе — Axios

3 часа назад

Claude Fable 5 могут вернуть уже на следующей неделе — Axios

Администрация Трампа близка к тому, чтобы разрешить Anthropic восстановить доступ к Claude Fable 5 — самой мощной модели компании, которая остается оффлайн уже 15 дней. Об этом сообщил Axios со ссылко

Samsung столкнулась с иском о нарушении десяти патентов

3 часа назад

Samsung столкнулась с иском о нарушении десяти патентов

Компания Samsung столкнулась с патентным троллем: фирма Tau Ceti Ventures подала иск против Samsung в Окружной суд Восточного округа Техаса. Компания утверждает, что Samsung нарушила десять её патенто

4 часа назад

Использование ИИ в преступлениях станет отягчающим обстоятельством

На Петербургском международном юридическом форуме замначальника следственного департамента МВД Данил Филиппов заявил: ведомство поддерживает инициативу Следственного комитета — сделать использование и