1 час назад

Лауреат премии Тьюринга: Claude Mythos нельзя оставлять под контролем Anthropic

2 мин

Лауреат премии Тьюринга Йошуа Бенжио заявил, что Claude Mythos Preview ставит вопрос не только о кибербезопасности, но и о контроле над ИИ-инфраструктурой. В интервью Fortune он сформулировал проблему так: "Нет смысла в том, что частные лица решают судьбу инфраструктуры за всех остальных. А что насчет всех компаний и стран, которые не получили доступ?"

Поводом стала программа Anthropic Project Glasswing, представленная 7 апреля. В ее рамках доступ к Claude Mythos Preview получили стартовые партнеры Anthropic, среди них AWS, Apple, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA и Palo Alto Networks. Позже организация расширила доступ еще более чем на 40 организаций, которые создают или поддерживают критически важную программную инфраструктуру.

Партнеры Project Glasswing используют Mythos для задач в области кибербеза: поиска и исправления уязвимостей, анализа бинарных файлов, защиты конечных устройств и пентестов. Anthropic пишет, что не планирует создавать Claude Mythos Preview общедоступной, пока не появятся более надежные способы блокировать самые опасные ответы модели. Компания также обещает на протяжении 90 дней рассказать, что удалось узнать в контексте проекта и какие исправленные уязвимости можно раскрыть.

Именно частичный доступ выглядит центральной проблемой для Бенжио. Если схема действительно помогает находить уязвимости быстрее людей, первые участники программы получают преимущество в защите своей инфраструктуры. Компании и страны за пределами списка Anthropic оказываются в худшем положении — и одновременно не участвуют в решении, кому дать такой средство, а кому нет.

Серьезность повода подтверждает оценка британского AI Security Institute. В его тестах Claude Mythos Preview стала первой моделью, которая прошла 32-шаговую симуляцию корпоративной кибератаки от начала до конца: успешно завершила 3 попытки из 10 и в среднем выполняла 22 шага из 32. При этом AISI отдельно оговорил, что тестовая среда была слабее реальных хорошо защищенных сетей: без активных защитников, защитных инструментов и наказаний за действия, которые в реальности вызвали бы тревогу у службы безопасности.

Одновременно 21 апреля Bloomberg сообщил, что небольшая группа неавторизованных пользователей получила доступ к Mythos прямо в день анонса программы. Anthropic уже расследует сообщение о доступе через окружение стороннего подрядчика; по данным Bloomberg, группа использовала схема регулярно, но не для киберзадач. Сам эпизод усилил основной вопрос вокруг Mythos: кто способен контролировать доступ к моделям, которые одновременно могут быть инструментом защиты и потенциальным инструментом атаки.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Claude Mythos Anthropic Claude

Читают сейчас

29 минут назад

Honor представила линейку игровых ноутбуков Win H9 с шестью вентиляторами

Honor показала новую линейку игровых ноутбуков Win H9 с системой охлаждения из шести вентиляторов. Девайс предназначено для геймеров и создателей контента и обещает эффективное охлаждение при тихой ра

1 час назад

Proton Pass получит папки, SSH-агент и другие функции

Команда Proton представила весенне-летний план развития менеджера паролей Proton Pass, в котором появятся папки для организации учётных данных и заметок, SSH-агент и другие полезные функции. Читать да

1 час назад

Proton Pass получит папки, SSH-агент и другие функции

1 час назад

МВД России советует не ходить по ссылкам за пределы доменной зоны РФ

В МВД России порекомендовали не переходить по ссылкам вне национальной доменной зоны РФ, а также по ссылкам, которые, вероятно, маскируют фактический адрес. В ведомстве равным образом советуют не откр

3 часа назад

GPT-5.5, DeepSeek V4 и Kimi K2.6 уже доступны в Veai

Прогнали на нашем интерактивном бенчмарке gpt-5.5 показывает заметно более надёжный профиль работы с инструментами и проверкой собственного результата, чем gpt-5.4. По формальной проверке корректности