OpenAI анонсировала GPT-5.5-Cyber

2 мин
OpenAI анонсировала GPT-5.5-Cyber

OpenAI анонсировала цельный релиз GPT-5.5-Cyber. Модель не только тыкает в уязвимости и дыры, но и сама заделывает их. Изучаем тест производительности и думаем зачем оно надо.

Что за зверь?

GPT-5.5-Cyber умеет анализировать большие кодовые базы, проверять находки в песочнице и выдавать готовый патч с тестами под человеческую проверку. Всё в одном флаконе.

На бенчмарке CyberGym (1 507 известных уязвимостей из 188 опенсорс-проектов) модель набрала 85.6%. Для сравнения: обычный GPT-5.5 — 81.8%, а пресловутый Anthropic Mythos 5, который правительство США недавно отключило за «нарушение экспортного контроля», — 83.8%.

Скрытый текст

Кстати, о последней доступной новинке Anthropic, а именно о Opus 4.8 мы писали подробнее здесь.

На ExploitGym — 39.5% против 25.95% у базовой версии. На SEC-bench Pro — 69.8% против 63.1%. Цифры, конечно, от OpenAI. Но даже с поправкой на внутренний тест производительности — разрыв ощутимый.

А что в реальности?

В контексте проекта Daybreak модель уже прошлась по ядру Linux: нашла 8 утечек указателей и 24 эксплойта на повышение привилегий.

В OpenBSD вскрыла 23-летнюю use-after-free в семафорах System V. Да, двадцать три года. Во FreeBSD — 34 ошибки безопасности. В браузерах нашла дыры в движке V8 (Chrome) и WebAssembly (Firefox).

И это только начало.

Patch the Planet: опенсорсу прилетит патч

Совместно с Trail of Bits OpenAI запустила «Patch the Planet». Идея простая: безопасники проверяют находки ИИ и готовят патчи для мейнтейнеров, чтобы те не захлебнулись в ворохе отчётов.

Специалисты проверяют находки ИИ и готовят патчи для проектов, в том числе cURL, Python, Go, aiohttp и другие. В первую неделю работы они уже сотрудничали с 19 проектами

«Мы не хотим добавлять мейнтейнерам работы, — говорят в OpenAI. — Мы хотим её убрать».

Посмотрим, действительно ли работы станет меньше или начнутся бесконечные переделки за нейронками. Мало кто доверит ИИ латать важные куски. Модель ошибается. Она генерирует патчи, которые нужно проверять. Она не понимает контекст бизнес-логики. И да, она может налажать. К тому же, если ИИ умеет находить и чинить дыры, он умеет и находить и эксплуатировать их. Не зря же доступ к GPT-5.5-Cyber так тщательно ограничивают.

Еще есть большой вопрос относительно чувствительных данных. Модель не отправляет ваш исходник в облачный сервис? Отлично. Но кто проверяет, что она не «запоминает» чувствительные данные? Вопросов больше, чем ответов.

Во-вторых, если всё-таки быть оптимистами это звучит как манна небесная для тех, кто поддерживает критическую инфраструктуру в одиночку.

Но факт остаётся фактом: игра изменилась. ИИ больше не просто советчик. Он — полноценный участник процесса.

Читают сейчас

AMD выпустила исправление для драйвера FSR 26.6.2

8 минут назад

AMD выпустила исправление для драйвера FSR 26.6.2

AMD выпустила исправление для драйвера FSR 26.6.2. Пакет под названием Adrenalin Edition 26.6.3 Hotfix доступен на официальном сайте AMD Software, он совместим со всеми поддерживаемыми видеокартами и

Google объявила об открытии Play Store для сторонних платёжных систем

18 минут назад

Google объявила об открытии Play Store для сторонних платёжных систем

Google объявила о начале внедрения изменений в метод выставления счетов разработчикам по всему миру. Фиксированный сбор в размере 30% заменят «более низкими независимыми комиссиями», которые частично

23 минуты назад

С октября 2026 года самозанятые смогут функционировать на одного заказчика через цифровые платформы только 60 часов в месяц

С 1 октября 2026 года самозанятые смогут функционировать через цифровые платформы на одну компанию — заказчика их услуг менее чем 60 часов в месяц. В соответствии с принятым правительством постановлен

Google научил Gemini 3.5 Flash пользоваться компьютером и смартфоном

27 минут назад

Google научил Gemini 3.5 Flash пользоваться компьютером и смартфоном

Google встроил computer use — управление компьютером — прямо в Gemini 3.5 Flash, сделав его штатным инструментом модели. Теперь ИИ-агент на базе Flash сам смотрит на экран, кликает, печатает и листает

«Яндекс» модернизировал «Алису AI»: нейросеть стала лучше решать задачи, запоминать контекст и подстраиваться под пользователя

27 минут назад

«Яндекс» модернизировал «Алису AI»: нейросеть стала лучше решать задачи, запоминать контекст и подстраиваться под пользователя

«Яндекс» модернизировал модели, лежащие в основе чата с «Алисой AI»: языковую, поисковую и мультимодальную. После обновления нейросеть стала не только отвечать на вопросы, но и помогать пользователям