9 апреля 2026, 14:21

Внутренняя схема OpenAI решила еще 5 математических задач Эрдёша

3 мин

Команда математиков OpenAI — Борис Алексеев, Мо Паттерман, Мехтааб Сони, Марк Селлке и Грегори Валиант — выпустила на arXiv следующий препринт с решениями открытых задач, сформулированных Полом Эрдёшем. На этот раз задач пять: №960 про обычные прямые без "обычной клики", №987 про экспоненциальные суммы, №1091 про K4-free 4-хроматические графы, у которых все маленькие подграфы раскрашиваются в три цвета, №990 про разреженный вариант теоремы Эрдёша–Турана и №1141 про простые числа вида n − ak². Все пять доказательств целиком получены "внутренней моделью OpenAI", которая пока не доступна публике. Это прямое продолжение серии Short Proofs: первый препринт с тремя задачами вышел меньше двух недель назад.

Разработчики снова описывают свою роль предельно скромно — "переварить доказательства и отредактировать их для ясности и элегантности". Единственное содержательное изменение людьми внесено в доказательство для задачи №1091: исходный вариант модели опирался на представление через "склейки Хайоша", а авторы заменили его на более несложный аргумент через 2-вырожденность подграфов. По задаче №1141 модель доказала более общее утверждение, чем спрашивал Эрдёш: для любого фиксированного a≥1 только конечное число чисел n обладает свойством, что n − ak² простое для всех допустимых k. Исходная формулировка Эрдёша касалась только случая a=1.

Самое любопытное — эксперимент с GPT-5.4 Pro, самой мощной моделью компании, доступной сейчас публично. После того как авторы проверили решения внутренней модели, они пять раз независимо дали 5.4 Pro решить те же задачи. Из пяти задач модель справилась только с двумя: с задачей №960 (причем ее доказательство слабее — не закрывает случай, когда запрещенная клика имеет размер три) и с задачей №1141 (все пять попыток успешны). Остальные три задачи GPT-5.4 Pro не взял. В соцсетях уже появились предположения, что речь идет о внутренней модели под кодовым названием Spud, обучение которой OpenAI, по слухам, недавно завершила.

Особо выделяется подход задачи №1091, которое в X назвал любимым соавтор Мехтааб Сони. Эрдёш спрашивал: если у графа хроматическое число 4, а все маленькие подграфы раскрашиваются в три цвета, обязан ли он содержать нечетный цикл с большим числом хорд? Еще в 1982 году Хайнц-Юрген Восс доказал, что хотя бы две хорды у такого цикла найдутся. Внутренняя модель OpenAI закрыла усиленную версию вопроса: существует ли функция f(r), стремящаяся к бесконечности, такая что у нечетного цикла обязательно будет f(r) хорд. Ответ — нет: схема построила явный контрпример, семейство графов-"гусениц" из пятиугольных блоков, где у каждого цикла не больше десяти хорд. Сони предлагает читателям восстановить доказательство по картинке-схеме из препринта как упражнение — и отдельно отмечает, что саму схему нарисовал Codex.

ИИ решают задачи Эрдёша с начала этого года: в январе 2026-го связка GPT-5.2 Pro и Aristotle от Harmonic закрыла задачу №728 с машинной верификацией в Lean, а теперь внутренняя схема OpenAI представила за две недели уже восемь новых результатов в двух препринтах.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

GPT-5.4 Pro Spud GPT-5.5

Читают сейчас

1 час назад

В Китае начался суд в связи с смерти 32-летнего программиста, который, по заявлению семьи, умер после длительных переработок

В китайском Гуанчжоу началось судебное разбирательство по иску родственников 32-летнего программиста, который, как утверждают члены его семьи, умер в результате длительных переработок, сообщает China

3 часа назад

Вышел Grok 4.5 — схема доступна бесплатно в Cursor и Grok Build

SpaceXAI (так теперь называется xAI после слияния со SpaceX) открыла доступ к Grok 4.5. Схема стала вариантом по умолчанию в агенте Grok Build и появилась в Cursor на всех тарифах — там ее можно попро

3 часа назад

СМИ:«„Яндекс Маркет“ сокращает штат и бюджет»

«Яндекс Маркет» планирует сократить бюджет и штат. Об этом сообщило издание «Ведомости» со ссылкой на неназванные источники. По словам источников, сообщается о снижении бюджета с 14 млрд до 2 млрд руб

3 часа назад

Госдума приняла закон о поддержке Почты России сразу в двух чтениях

Госдума 8 июля 2026 года приняла закон о поддержке Почты России во втором и третьем чтениях. Документ закрепляет новые правила работы оператора и вводит электронную почтовую систему для доставки юриди

3 часа назад

Cursor выпустили Grok 4.5: флагман уровня Opus, обучали вместе со SpaceXAI

xAI называют её самой мощной моделью на сегодня и первой, которую строили не только под разработку софта. Модель уже доступна в Cursor и на первую неделю дают двойные лимиты использования. Отдельно ут