На 52,5% галлюцинаций меньше: вышла GPT-5.5 Instant

2 мин
На 52,5% галлюцинаций меньше: вышла GPT-5.5 Instant

OpenAI обновила базовую модель ChatGPT: на смену GPT-5.3 Instant пришла GPT-5.5 Instant. Схема включается по умолчанию на бесплатном тарифе, а платным подписчикам пригодится для быстрых ответов.

Основной заявленный прирост — точность: по внутренним тестам компании, новая схема допускает на 52,5% меньше галлюцинаций на запросах из чувствительных областей вроде медицины, права и финансов. На сложных диалогах, которые сами пользователи ранее помечали как содержащие фактические ошибки, GPT-5.5 Instant выдает на 37,3% меньше неточных утверждений.

Прирост в фактологичности подкреплен ростом на бенчмарках. На AIME 2025 (соревновательная математика) модель набрала 81,2% против 65,4% у предшественницы — скачок почти на 16 пунктов. На GPQA с задачами уровня PhD по естественным наукам — 85,6% против 78,5%. На MMMU-Pro (экспертное мультимодальное рассуждение) — 76,0% против 69,2%, на CharXiv-reasoning (анализ научных графиков) — 81,6% против 75,0%. Средняя ошибка парсинга документов на OmniDocBench снизилась с 14,6 до 12,5%.

Параллельно OpenAI поработала над тоном: схема стала короче и менее многословной. В одном из примеров из анонса GPT-5.5 Instant дает на 30,2% меньше слов и на 29,2% меньше строк, чем GPT-5.3 Instant — без потери сути. Организация обещает меньше избыточных уточняющих вопросов и почти полное отсутствие "лишних эмодзи", которые раздражали часть пользователей.

Вместе с моделью OpenAI выкатывает новую функцию — Memory Sources. Когда ответ персонализирован, рядом отображается список источников: какие сохраненные факты из памяти, прошлые чаты или подключенный Gmail повлияли на формулировку. Любой ресурс можно отметить как нерелевантный, скорректировать или удалить. Организация признает, что показ может быть неполным — например, отображаются не все прочитанные чаты, а только наиболее значимые.

Раскатка GPT-5.5 Instant начинается сегодня и охватит всех пользователей ChatGPT, в том числе бесплатные тарифы. В api модель доступна как chat-latest. GPT-5.3 Instant остается в настройках платных аккаунтов еще три месяца, после чего ее уберут. Расширенная персонализация на основе чатов, файлов и Gmail пока работает только в вебе для Plus и Pro, мобильные клиенты и тарифы Free, Go, Business и Enterprise получат функцию в ближайшие недели. Memory Sources раскатываются всем пользователям ChatGPT во всех потребительских планах.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Хакатон-дайджест №34 на май

34 минуты назад

Хакатон-дайджест №34 на май

Ежемесячная подборка хакатонов! Майский выпуск: ловите подборку ИТ-соревновании, где ваш исходник, аналитика и креатив превращаются в призовые, офферы и строчки в портфолио. В этом месяце — амбициозны

AvitoTech едет в Екатеринбург: дринкап для тимлидов

1 час назад

AvitoTech едет в Екатеринбург: дринкап для тимлидов

28 мая мы в первый раз проводим ивент на Урале — собираем тимлидов, техлидов и руководителей IT-команд из Екатеринбурга на неформальный вечер в центре города. Формат — дискуссионные круглые столы с эк

Chrome может незаметно загрузить на диск локальную ИИ-модель Gemini Nano на 4GB

1 час назад

Chrome может незаметно загрузить на диск локальную ИИ-модель Gemini Nano на 4GB

Прямо сейчас эта новость форсится под заголовком "Google Украл на вашем диску ЦЕЛЫХ 4GB без вашего ведова!!!", но бояться совсем нечего. Официальная документы Chrome прямо говорит, что Prompt программ

Uber потратил годовой бюджет на ИИ за 4 месяца — и теперь выбирает между токенами и людьми

3 часа назад

Uber потратил годовой бюджет на ИИ за 4 месяца — и теперь выбирает между токенами и людьми

CEO Uber Дара Хосровшахи в подкасте Decoder от The Verge рассказал, организация израсходовала годовой бюджет на AI-инструменты приблизительно за 4 месяца. Согласно заявлению Хосровшахи, если перерасхо

В GitHub объяснили инциденты с недоступностью платформы

4 часа назад

В GitHub объяснили инциденты с недоступностью платформы

Разработчики объяснили, с чем связаны два последних инцидента с доступностью GitHub — с процессами по увеличению мощности платформы для повышения её отказоустойчивости. Читать далее