Вышла GPT-5.5 — схема, которая сама создала часть своего инференса

3 мин
Вышла GPT-5.5 — схема, которая сама создала часть своего инференса

OpenAI выпустила GPT-5.5 — свежий флагман, который, по заявлению компании, сам помог переписать часть своего инференс-стека. Модель проанализировала недели продакшн-трафика и написала механизм балансировки запросов между вычислительными ядрами GPU — после этого скорость генерации токенов в продакшне выросла больше чем на 20%. GPT-5.5 и GPT-5.5 Pro сегодня раскатываются в ChatGPT и Codex для Plus, Pro, Business и Enterprise пользователей; в программный оболочку OpenAI обещает поставить схема в ближайшее время.

Это продолжение тренда, который компания обозначила еще с GPT-5.3-Codex в феврале, — тогда ранние версии модели помогали команде дебажить собственное обучение и анализировать результаты оценки. С GPT-5.5 шаг крупнее: раньше запрос на GPU делился на фиксированное число кусков, что было неоптимально для реальных паттернов нагрузки, — теперь модель динамическая, и исходник для нее написала сама схема через Codex.

Побочный эффект этой работы — задержки не выросли. Крупные модели обычно обслуживаются медленнее, но по задержке на токен GPT-5.5 в продакшне совпадает с GPT-5.4 при заметно более высоком уровне интеллекта. На тех же задачах в Codex новая модель использует меньше токенов, чем предшественница.

На бенчмарках GPT-5.5 обгоняет почти всех конкурентов. На Terminal-Bench 2.0, где оценивают агентные задачи в командной строке, схема берет 82,7% — против 69,4% у Claude Opus 4.7 и 68,5% у Gemini 3.1 Pro. На FrontierMath Tier 4 — 35,4% против 22,9% у Opus 4.7. На ARC-AGI-2 — 85,0%. Особенно заметен скачок на длинном контексте: на Graphwalks BFS с окном в миллион токенов модель выдает F1-метрику 45,4% против 9,4% у GPT-5.4. На SWE-Bench Pro — 58,6%, чуть ниже результата Opus 4.7 (64,3%), но Anthropic сама признала, что ее схема могла обучаться на части задач этого бенчмарка.

В дополнение к бенчмарков OpenAI приводит несколько примеров, где GPT-5.5 сделала то, что раньше не удавалось моделям. Внутренняя версия с кастомной обвязкой нашла новое доказательство давно известной асимптотической оценки для недиагональных чисел Рамсея — одного из центральных объектов комбинаторики; результат был формально проверен в Lean. Иной сюжет связан с кибербезопасностью: GPT-5.5 в начальный раз в линейке получила уровень High по Preparedness Framework — внутренней шкале OpenAI для оценки опасных возможностей модели. Параллельно компания запускает программу Trusted Access for Cyber, в контексте которой верифицированные защитники критической инфраструктуры получают доступ к более свободной версии модели с меньшим числом ограничений.

GPT-5.5 в программный оболочку будет стоить $5 за миллион входных токенов и $30 за миллион выходных, GPT-5.5 Pro — $30 и $180 соответственно. Это дороже GPT-5.4, но организация утверждает, что за счет токеновой эффективности итоговые счета в Codex для большинства сценариев выйдут меньше. Pro-версия в ChatGPT доступна для Pro, Business и Enterprise, базовая GPT-5.5 — также для Plus.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

DJI представила дроны Lito 1 и X1 с запись 4K HDR для начинающих пилотов

10 минут назад

DJI представила дроны Lito 1 и X1 с запись 4K HDR для начинающих пилотов

DJI анонсировала линейку дронов Lito, предназначенных для начинающих пилотов. Линейка состоит из двух дронов, которые различаются камерами. Цены в Европе начинаются от 350 евро. Читать далее

Tencent запустила тестирование ИИ-агента QClaw, но сильно ограничила к нему доступ

1 час назад

Tencent запустила тестирование ИИ-агента QClaw, но сильно ограничила к нему доступ

Tencent запустила публичный бета-тест собственного ИИ-агента QClaw для пользователей по всему миру — приложение работает на Windows и Mac без сложной технической настройки, тем не менее на старте дост

OpenAI представили свежий флагман — GPT-5.5

1 час назад

OpenAI представили свежий флагман — GPT-5.5

OpenAI выпустила GPT-5.5 — свежий флагман, который, по заявлению компании, помог оптимизировать собственный инференс-стек. В соответствии с заявлению компании, GPT-5.5 в кодинг-агенте Codex оптимизиро

OpenAI выпустили GPT-5.5: пишет исходник дешевле предшественника

1 час назад

OpenAI выпустили GPT-5.5: пишет исходник дешевле предшественника

GPT-5.5 — это следующая схема после GPT-5.4, ориентированная в первую очередь на агентную работу: многошаговые задачи, где схема планирует, использует инструменты и доводит работу до конца без постоян

Gemini против Mythos: Google отвечает Anthropic и OpenAI армией агентов вместо одной «страшной» модели

1 час назад

Gemini против Mythos: Google отвечает Anthropic и OpenAI армией агентов вместо одной «страшной» модели

На Google Cloud Next 2026 в Лас-Вегасе компания представила стратегию кибербезопасности, которая расходится с подходом Anthropic и OpenAI. Вместо отдельной cyber-модели Google встраивает универсальный