Статьи по тегу

15 мая 2026, 10:32

«Гипотезу Римана может доказать анонимный аккаунт»: математик MIT — об опыте работы с GPT-5.5-Pro

Дэвид Туртуреан, аспирант MIT, опубликовал в X подход задачи #696 из списка Эрдёша через GPT-5.5-Pro — и обнаружил, что днем раньше на форуме erdosproblems.com уже появилось детальное частичное решени

15 мая 2026, 00:12

Codex добавили в портативный ChatGPT — для всех планов, в том числе бесплатный

OpenAI запустила Codex в мобильном приложении ChatGPT в режиме preview. Версии для iOS и Android раскатывают на всех тарифах — включая Free и Go. По данным компании, кодинг-агентом сейчас пользуются б

12 мая 2026, 07:00

Gmail, Salesforce и LinkedIn в одном агенте: OpenAI опубликовал Codex для Chrome

OpenAI 7 мая опубликовал плагин Codex для Chrome — агент получает прямой доступ к залогиненным сессиям пользователя на любых сайтах: от Gmail и LinkedIn до Salesforce и корпоративных панелей. Поводом

10 мая 2026, 18:15

Opus 4.6 в 81% попыток сам «копирует себя» на чужой хост через дыру в коде — исследование Palisade

Лаборатория Palisade Research замерила, как часто современные ИИ-модели сами могут взломать чужой сервер и инсталлировать туда копию своих весов. У Claude Opus 4.6 получилось в 81% попыток, у GPT-5.4

9 мая 2026, 21:26

Из экспоненты в полином за два часа: что GPT-5.5 Pro сделала с задачей по теории чисел

Тимоти Гауэрс — обладатель Филдсовской премии и кембриджский профессор — опубликовал в блоге отчет о своем эксперименте с GPT-5.5 Pro: за неполных два часа модель улучшила границу в открытой задаче по

7 мая 2026, 21:11

Claude Opus 4.7 стал лучшим ИИ в рефакторинге кода. Второе место у GPT-5.5

Scale Labs запустила Refactoring Leaderboard — третий и новейший элемент исследовательского пакета SWE Atlas, оценивающего ИИ-агенты на задачах разработки ПО. В отличие от классических бенчмарков, где

5 мая 2026, 20:17

На 52,5% галлюцинаций меньше: вышла GPT-5.5 Instant

OpenAI обновила базовую схема ChatGPT: на смену GPT-5.3 Instant пришла GPT-5.5 Instant. Схема включается по умолчанию на бесплатном тарифе, а платным подписчикам пригодится для быстрых ответов. Ознако

4 мая 2026, 16:15

GPT-5.5 поручили организовать вечеринку в честь своего запуска — а гостей отобрал Codex

Глава OpenAI Сэм Альтман на конференции Stripe Sessions рассказал, что поручил GPT-5.5 спланировать вечеринку в честь ее запуска — предложенный моделью скрипт оказался настолько хорош, что Альтман реш

1 мая 2026, 23:49

GPT-5.5 и Opus 4.7 провалились в ARC-AGI-3. Вот почему

ARC Prize Foundation опубликовал детальный разбор того, как новейшие модели OpenAI и Anthropic проходят интерактивный бенчмарк ARC-AGI-3. GPT-5.5 набрала 0,43%, Opus 4.7 — 0,18%, тогда как люди решают