Вышла GPT-5.4 — первая схема OpenAI, которая управляет компьютером

2 мин
Вышла GPT-5.4 — первая схема OpenAI, которая управляет компьютером

OpenAI выпустила GPT-5.4 — новую флагманскую модель, которая заменяет сразу две предшественницы: GPT-5.2 (универсальную) и GPT-5.3-Codex (кодерскую). Контекстное окно выросло до 1,05 млн токенов — в 2,5 раза больше, чем у GPT-5.2. Одновременно GPT-5.4 — самая токеноэффективная схема серии: она тратит значительно меньше токенов на решение тех же задач, что частично компенсирует рост цены в api до $2,50 за миллион входных и $15 за миллион выходных токенов. Для сложных задач доступна GPT-5.4-pro ($30/$180).

Главная новинка — встроенный computer use: GPT-5.4 стала первой основной моделью OpenAI, которая умеет взаимодействовать с программами через оболочку — ознакомиться скриншоты, нажимать кнопки, заполнять формы и проверять результат. Раньше эта опция была доступна только в экспериментальных моделях. Еще одно нововведение — tool search, позволяющий подгружать определения инструментов по запросу, а не передавать все сразу. Это снижает расход токенов и улучшает точность выбора нужного инструмента в сложных агентных сценариях.

На бенчмарках GPT-5.4 заметнее всего прибавила именно в агентных задачах (далее все сравнения - с GPT-5.2): на OSWorld-Verified — 75% против 47,3% у GPT-5.2, на BrowseComp — 82,7% против 65,8%, на GDPval — 83% против 70,9%. Результаты на SWE-Bench Pro скромнее: 57,7% против 55,6%. Максимальный уровень рассуждений расширен до xhigh — режим "экстремального мышления", в котором модель тратит значительно больше вычислительных ресурсов на сложные задачи. Кроме того, OpenAI называет GPT-5.4 самой точной моделью: ложные утверждения встречаются на 33% реже, а доля ответов с ошибками снизилась на 18%.

Модель равным образом получила нативную поддержку компакции — сжатия контекста для длинных агентных сессий, чтобы не терять ключевую информацию при многошаговых задачах. GPT-5.4 стала дефолтной моделью и в api, и в Codex. В ChatGPT модель раскатывается прямо сейчас, пользователи Pro-подписки сразу получат Pro-версию.

Еще одно заметное изменение в ChatGPT: GPT-5.4 Thinking теперь показывает план работы перед выполнением сложного запроса — потребитель может скорректировать направление прямо в процессе, не дожидаясь готового ответа.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Представлен публике публичный инициатива CSVMusic для преобразования плейлистов из музыкальных сервисов в файлы с набором тегов

3 часа назад

Представлен публике публичный инициатива CSVMusic для преобразования плейлистов из музыкальных сервисов в файлы с набором тегов

Состоялся выпуск открытого проекта под названием CSVMusic. Это подход для преобразования плейлистов из музыкальных сервисов в аудиофайлы с полным набором тегов. Исходный исходник проекта написан на Py

Версия LibreSSL 4.3.0

3 часа назад

Версия LibreSSL 4.3.0

18 апреля 2026 года состоялся выпуск криптографической библиотеки LibreSSL 4.3.0 (форка OpenSSL, который с 2014 года разрабатывается сообществом отдельно с целью модернизации кодовой базы, повышения б

xAI включает гиперскорость: Grok 4.3 уже в бете, 4.4 и 4.5 на подходе

9 часов назад

xAI включает гиперскорость: Grok 4.3 уже в бете, 4.4 и 4.5 на подходе

17 апреля xAI тихо выкатила Grok 4.3 в ранний бета-доступ, а днем позже Илон Маск опубликовал план дальнейших релизов: до конца мая размер модели вырастет втрое — с 0,5 до 1,5 триллиона параметров. Пр

Заключительный этап Всероссийской олимпиады школьников по математике проходит в Москве

12 часов назад

Заключительный этап Всероссийской олимпиады школьников по математике проходит в Москве

В Москве стартовал заключительный этап Всероссийской олимпиады школьников по математике. Ивент проходит на площадке Центрального университета и продлится до 20 апреля 2026 года. Всероссийская олимпиад

Робот пробежал полумарафон быстрее человека-рекордсмена

12 часов назад

Робот пробежал полумарафон быстрее человека-рекордсмена

Гуманоидный робот, победивший в воскресенье в Пекине полумарафон среди роботов, пробежал дистанцию быстрее человека-рекордсмена. Победитель от китайского производителя смартфонов Honor преодолел диста