9 апреля 2026, 14:21
Внутренняя схема OpenAI решила еще 5 математических задач Эрдёша

Команда математиков OpenAI — Борис Алексеев, Мо Паттерман, Мехтааб Сони, Марк Селлке и Грегори Валиант — выпустила на arXiv следующий препринт с решениями открытых задач, сформулированных Полом Эрдёшем. На этот раз задач пять: №960 про обычные прямые без "обычной клики", №987 про экспоненциальные суммы, №1091 про K4-free 4-хроматические графы, у которых все маленькие подграфы раскрашиваются в три цвета, №990 про разреженный вариант теоремы Эрдёша–Турана и №1141 про простые числа вида n − ak². Все пять доказательств целиком получены "внутренней моделью OpenAI", которая пока не доступна публике. Это прямое продолжение серии Short Proofs: первый препринт с тремя задачами вышел меньше двух недель назад.
Разработчики снова описывают свою роль предельно скромно — "переварить доказательства и отредактировать их для ясности и элегантности". Единственное содержательное изменение людьми внесено в доказательство для задачи №1091: исходный вариант модели опирался на представление через "склейки Хайоша", а авторы заменили его на более несложный аргумент через 2-вырожденность подграфов. По задаче №1141 модель доказала более общее утверждение, чем спрашивал Эрдёш: для любого фиксированного a≥1 только конечное число чисел n обладает свойством, что n − ak² простое для всех допустимых k. Исходная формулировка Эрдёша касалась только случая a=1.
Самое любопытное — эксперимент с GPT-5.4 Pro, самой мощной моделью компании, доступной сейчас публично. После того как авторы проверили решения внутренней модели, они пять раз независимо дали 5.4 Pro решить те же задачи. Из пяти задач модель справилась только с двумя: с задачей №960 (причем ее доказательство слабее — не закрывает случай, когда запрещенная клика имеет размер три) и с задачей №1141 (все пять попыток успешны). Остальные три задачи GPT-5.4 Pro не взял. В соцсетях уже появились предположения, что речь идет о внутренней модели под кодовым названием Spud, обучение которой OpenAI, по слухам, недавно завершила.
Особо выделяется подход задачи №1091, которое в X назвал любимым соавтор Мехтааб Сони. Эрдёш спрашивал: если у графа хроматическое число 4, а все маленькие подграфы раскрашиваются в три цвета, обязан ли он содержать нечетный цикл с большим числом хорд? Еще в 1982 году Хайнц-Юрген Восс доказал, что хотя бы две хорды у такого цикла найдутся. Внутренняя модель OpenAI закрыла усиленную версию вопроса: существует ли функция f(r), стремящаяся к бесконечности, такая что у нечетного цикла обязательно будет f(r) хорд. Ответ — нет: схема построила явный контрпример, семейство графов-"гусениц" из пятиугольных блоков, где у каждого цикла не больше десяти хорд. Сони предлагает читателям восстановить доказательство по картинке-схеме из препринта как упражнение — и отдельно отмечает, что саму схему нарисовал Codex.
ИИ решают задачи Эрдёша с начала этого года: в январе 2026-го связка GPT-5.2 Pro и Aristotle от Harmonic закрыла задачу №728 с машинной верификацией в Lean, а теперь внутренняя схема OpenAI представила за две недели уже восемь новых результатов в двух препринтах.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

46 минут назад
Truecaller запустила служба eSIM
Платформа распознавания номеров Truecaller запустила сервис eSIM для путешественников. Запуск сервиса связан с тем, что организация стремится укрепить свои позиции и диверсифицировать бизнес на фоне с

1 час назад
В Роскомнадзоре опровергли блокировку DeepSeek
В ведомстве заявили СМИ, что регулятор не получал решений от уполномоченных органов об ограничении доступа к ИИ‑платформе для пользователей в РФ. По сообщению ведомства, в РКН не вводили ограничения в

1 час назад
DeepSeek перестал открываться из России
Российские пользователи в ночь на 24 мая массово столкнулись с недоступностью DeepSeek — веб-сайт chat.deepseek.com перестал открываться при прямом подключении из России. На сервисе detector404.ru за

3 часа назад
NVIDIA ускорила языковую схема в 4 раза: вышла Nemotron-Labs Diffusion
NVIDIA выпустила открытое семейство языковых моделей Nemotron-Labs Diffusion — на флагманском GPU B200 они генерируют 865 токенов в секунду, в 4 раза быстрее обычной токен-за-токеном генерации на том
4 часа назад
В России разработали механизмы для работы банкоматов без интернета
Минцифры РФ и операторы связи разработали механизмы, позволящие банкоматам и платёжным терминалам работать без мобильного интернета. Об этом заявила глава Центрального банка Эльвира Набиуллина на съез