29 мая 2026, 08:37

Claude Mythos скоро выйдет для всех: что это значит для кибербезопасности

5 мин

28 мая Anthropic выпустила Opus 4.8 и анонсировала новую схема: Mythos-class модели станут доступны всем «в течение нескольких недель». Разбираем, что умеет модель, которую год держали в закрытом контуре, почему её решились отпустить - и что с этим делать ИБ-команде уже сейчас.

Mythos

Вчерашний появление Opus 4.8 – очередное продвижение моделей для разработки, судя по тестовым метрикам.

Но для кибербезопасности интереснее про Mythos.

«В течение нескольких недель» - так Anthropic сформулировала дедлайн, когда Mythos-class модели станут доступны всем клиентам. Ту самую схема, которую организация почти год намеренно держала подальше от публики. Не потому, что сырая. А потому что слишком хороша в одном конкретном деле – находить уязвимости и создавать к ним эксплойты.

Что вообще такое Claude Mythos

Claude Mythos это общая frontier-модель, которая оказалась настолько сильна в задачаъ кибербезопасности, что Anthropic приняла беспрецедентное для себя подход: не выпускать её публично, пока не появятся специальные защитные механизмы, а крупные проекты не выпустят исправления критичных уязвимостей, которые можно найти с помощью нее.

Что именно она умеет - задокументировано в рамках Project Glasswing (Anthropic):

Обнаружила тысячи zero-day уязвимостей во всех major ОС и браузерах.
Нашла 27-летнюю уязвимость в OpenBSD - такую, что позволяет удалённо уронить любую машину простым подключением к ней.
Нашла 16-летнюю уязвимость в FFmpeg. В строке кода, через которую автоматические тесты прошли 5 миллионов раз и ничего не заметили.
Автономно нашла и скомпоновала некоторое количество уязвимостей в Linux kernel для эскалации привилегий до root (Reddit / r/accelerate, Anthropic).
Нашел 271 уязвимость в Firefox.

Метрика	Mythos Preview	Opus 4.6
Рабочий эксплойт с первой попытки (CyberGym)	83,1%	66,6%
Экспертные задачи (нерешаемые до апреля 2025)	73% успеха	-
Разработка эксплойтов для найденных уязвимостей	в ~100 раз успешнее	базовый уровень

Источники: Anthropic / Project Glasswing по бенчмаркам и кратности, PwC по кратности эксплойтов, экспертные задачи - по оценке AISI.

По оценке британского AI Security Institute, в контролируемых условиях Mythos Preview способна автономно проводить многоэтапные атаки на уязвимые сети - те, что у живого специалиста занимают дни (AISI).

Почему держали под замком - и что изменилось

7 апреля 2026 года Anthropic объявила Project Glasswing - закрытую инициативу, в контексте которой Mythos Preview раздали ограниченному кругу: AWS, Apple, Microsoft, Google, CrowdStrike, Palo Alto Networks, Cisco, NVIDIA, JPMorganChase, Linux Foundation и ещё 40+ организаций (Anthropic).

Под это Anthropic выделила до $100 млн в токенах (новая валюта которую сами же «майнят», уже и доли в стартапах на нее покупают) на использование модели плюс $4 млн пожертвований open-source организациям безопасности.

Логика, почему отпускают сейчас, описана в анонсе Opus 4.8. План такой: сначала обкатать новые cyber-ограничения на менее опасной модели - Opus-уровня, - отладить, а потом переносить на Mythos-class. По части alignment (согласованности поведения модели) Opus 4.8 уже сопоставима с Mythos Preview и лучше Opus 4.7.

При этом сам Mythos Preview в публичный доступ не пойдёт. Речь о новой Mythos-class безопасной модели.

Будет ли массовый Mythos безопасным

Anthropic планирует ставить в качестве safeguards следующие ограничения (WaveSpeed, Anthropic):

Технические блокировки наиболее опасных outputs.
Cyber Verification Program – отдельная регистрация для легитимных security-специалистов.
Обкатку safeguards на моделях Opus-уровня перед переносом на Mythos (в теории Opus 4.8 должен стать хуже в атакующих задачах кибербеза по-сравнению с Opus 4.7).

Детальную архитектуру этих safeguards Anthropic не раскрыла.

Но главная проблема даже не в самом Mythos. Организация Aisle сумела воспроизвести часть уязвимостей, найденных Anthropic, на старых, дешёвых и публичных моделях. Разница пока в том, что найти дыру проще, чем написать к ней эксплойт. Но этот зазор сжимается (Schneier on Security).

В целом использование LLM не создает новых категорий угроз, а ускоряет существующие. Окно между обнаружением уязвимости и рабочим эксплойтом сжимается – об этом говорят все метрики и новости о появлении CVE и начале их эксплуатации.

Еще одна деталь от самой Anthropic: инженеры без формальной security-подготовки собрали рабочие эксплойты за ночь, пользуясь Mythos. Падение «барьера входа» делает атаки дешевле, а значит потенциально гораздо более массовыми. Unit-экономика «темной» стороны ИБ улучшается.

И даже если ограничения безопасности у Anthropic выйдут идеальными - аналогичные возможности появятся у других лабораторий через 6-18 месяцев. Включая там, где про защита думают в последнюю очередь.

Что это меняет для ИБ-команд

Раньше exploit lifecycle мерили днями и неделями. Публикация CVE - аналитика - PoC - рабочий эксплойт - массовое применение. Между этапами было время в спокойном режиме протестировать, накатить патчи.

Теперь цепочка от reconnaissance до payload сжимается до часов. Иногда минут.

Представьте: процесс патчинга, рассчитанный на 30-90 дней, против атакующего, у которого от CVE до рабочего эксплойта - ночь. Это как пытаться залатать пробоину, пока корабль уже черпает воду бортом.

Вопрос ребром: атакующий с AI против защитника с AI – кто будет быстрее? Пока защитник запрягает, атакующий уже едет. У него нет процесса согласований и пятничного code freeze.

Что создавать прямо сейчас: семь приоритетов

Ниже – то, о чем стоит задуматься.

Приоритет 1. Скорость установки патчей

Автоматизация установки, тестирования – так, чтобы в течении квартала можно было обновлять прод хоть каждую ночь.

Приоритет 2. AI в workflow безопасной разработки

Внедрите LLM-based vulnerability discovery и анализ кода в свой процедура до того, как это сделают атакующие.
Протестируйте AI-assisted подходы в генерации патчей, анализе исходников, triage.

Логика проста: если функция есть у обеих сторон, выигрывает тот, кто встроил её в рутину первым.

Дисциплина

По сути никакой магии новые AI-модели не несут. Только ускорение того, что и так происходило.

Но ускорение - это тоже сдвиг. Когда скорость меняется на порядок, придется не «больше работать» чтобы быстрее двигать задачи по сутиющим процессам, необходимо будет изменить процессы для большей скорости.

Игнорировать новые вызовы и считать их «просто хайпом» точно не стоит.

mythos ai antropic информационная безопасность уязвимости

Читают сейчас

2 часа назад

Google Картинки получат редизайн в стиле Pinterest с галереей рекомендаций, коллекциями и ИИ-генерацией

Google представила редизайн Google Картинок (Google Images) по образцу Pinterest, объяснив изменение попыткой превращения сервиса в источник для вдохновения. Обновление выходит в честь 25-летия сервис

3 часа назад

Апдейт Telegram: расширенное Markdown-форматирование и сообщества, напоминающая Discord

Команде Telegram выпустила большое апдейт мессенджера. Ключевыми нововведениями стали расширенный Markdown-редактор и сообщества в формате, похожем на сервера в Discord. Читать далее

3 часа назад

Утверждён план доступа цифровых платформ и банков к данным ФТС ФНС и Росреестра с реализацией через программный оболочку

Вице-премьер Дмитрий Григоренко утвердил «дорожную карту» по предоставлению и упрощению доступа цифровых платформ и банков к данным ФТС, ФНС и Росреестра. Документ был утверждён 7 июля 2026 года. Об э

3 часа назад

Больше трети российских компаний продолжает применять зарубежное сетевое оборудование

Организация OCS провела исследование, по которому в 2026 году 36% средних, крупных и крупнейших компаний не перешли на российские решения для веб инфраструктуры. Исследование проводилось посредством о

3 часа назад

Представлен публике публичный инициатива BottleShip для запуска тяжёлых Windows-игр в браузере с высокоуровневой эмуляцией

Разработчик и энтузиаст ретро-гейминга Евгений Смирнов (@jenissimo ) показал публичный проект под названием BottleShip. Это подход для запуска тяжёлых игр для Windows в браузере с принципиально новым