
5 часов назад
Из экспоненты в полином за два часа: что GPT-5.5 Pro сделала с задачей по теории чисел
Тимоти Гауэрс — обладатель Филдсовской премии и кембриджский профессор — опубликовал в блоге отчет о своем эксперименте с GPT-5.5 Pro: за неполных два часа модель улучшила границу в открытой задаче по

7 мая 2026, 21:11
Claude Opus 4.7 стал лучшим ИИ в рефакторинге кода. Второе место у GPT-5.5
Scale Labs запустила Refactoring Leaderboard — третий и новейший элемент исследовательского пакета SWE Atlas, оценивающего ИИ-агенты на задачах разработки ПО. В отличие от классических бенчмарков, где

5 мая 2026, 20:17
На 52,5% галлюцинаций меньше: вышла GPT-5.5 Instant
OpenAI обновила базовую схема ChatGPT: на смену GPT-5.3 Instant пришла GPT-5.5 Instant. Схема включается по умолчанию на бесплатном тарифе, а платным подписчикам пригодится для быстрых ответов. Ознако

4 мая 2026, 16:15
GPT-5.5 поручили организовать вечеринку в честь своего запуска — а гостей отобрал Codex
Глава OpenAI Сэм Альтман на конференции Stripe Sessions рассказал, что поручил GPT-5.5 спланировать вечеринку в честь ее запуска — предложенный моделью скрипт оказался настолько хорош, что Альтман реш

1 мая 2026, 23:49
GPT-5.5 и Opus 4.7 провалились в ARC-AGI-3. Вот почему
ARC Prize Foundation опубликовал детальный разбор того, как новейшие модели OpenAI и Anthropic проходят интерактивный бенчмарк ARC-AGI-3. GPT-5.5 набрала 0,43%, Opus 4.7 — 0,18%, тогда как люди решают

30 апреля 2026, 23:38
10 минут вместо 12 часов: GPT-5.5 решила экспертную кибер-задачу за $1.73
Британский AI Security Institute (AISI) опубликовал оценку кибер-возможностей GPT-5.5. По собственной оценке института, это потенциально самая сильная схема из всех протестированных. На наборе эксперт

30 апреля 2026, 08:43
Как GPT-5.5 стала одержима гоблинами. OpenAI разобрала собственную ошибку в RL
OpenAI опубликовала технический разбор необычного бага: флагманская GPT-5.5 в кодинг-агенте Codex стала странно часто вставлять в ответы гоблинов, гремлинов, троллей, енотов и голубей — и компании при

28 апреля 2026, 18:41
«ИИ развивается «удивительно медленно»» — основной ученый OpenAI пообещал чрезвычайное ускорение
Главный ученый OpenAI Якуб Пахоцкий считает последние годы развития ИИ "удивительно медленными" — и обещает ускорить темп. Якуб выступил с этим тезисом на пресс-брифинге OpenAI 23 апреля в связи с рел

28 апреля 2026, 10:01
Галлюцинации недели: DeepSeek V4, Kimi K2.6 и неконтролируемые галлюцинации нового флагмана OpenAI
Codex на Mac становится супераппом, Anthropic выкатила постмортем на собственные баги, а DeepSeek на 58 страницах объяснил, почему у них лучшая open weight модель. Читать далее