Самообучающийся ИИ может появиться в конце 2028 года — сооснователь Anthropic

3 мин
Самообучающийся ИИ может появиться в конце 2028 года — сооснователь Anthropic

Джек Кларк, сооснователь Anthropic и автор рассылки Import AI, опубликовал эссе с прогнозом: вероятность того, что к концу 2028 года появится ИИ-система, способная автономно обучить своего преемника без участия человека, составляет 60 процентов+. Для 2027 года Кларк оценивает ту же вероятность в 30 процентов.

В эссе используется термин "no-human-involved AI R&D" — модель, в достаточной степени мощная, чтобы самостоятельно создать следующую версию самой себя. Сам автор несколько нервничает по этому поводу: "Я не знаю, как уложить это в голове. Если это случится, мы пересечем Рубикон в почти невозможное для прогнозирования будущее". Кларк подчеркивает, что выводы основаны не на инсайдерской информации Anthropic, а на анализе публичных источников — arXiv, bioRxiv, NBER и продуктов фронтирных компаний.

Аргумент собран как мозаика из десятков бенчмарков — Кларк сознательно отказывается от ставки на одну метрику. SWE-Bench, известный проверка на решение реальных GitHub-задач, в 2023 году давал Claude 2 итог около 2%, а в 2026-м Claude Mythos Preview — 93,9%, фактически насыщая бенчмарк. Длительность задач, с которыми ИИ справляется автономно, по горизонту METR росла так: 30 секунд у GPT-3.5 в 2022, 4 минуты у GPT-4 в 2023, 40 минут у o1 в 2024, около 6 часов у GPT 5.2 (High) в 2025, около 12 часов у Opus 4.6 в 2026.

Главное в эссе — рост на бенчмарках, напрямую связанных с автоматизацией ИИ-исследований. CORE-Bench, тест на воспроизведение вычислительных результатов научных статей, прошел путь с 21,5% у GPT-4o с агентной обвязкой в сентябре 2024 до 95,5% у Opus 4.5 в декабре 2025 — один из авторов бенчмарка публично объявил его решенным. На MLE-Bench, где ИИ автономно участвует в 75 Kaggle-соревнованиях, итог вырос с 16,9% у o1 в октябре 2024 до 64,4% у Gemini 3 в феврале 2026. На PostTrainBench, проверяющем способность фронтирных моделей дообучать слабые модели с открытыми весами, топовые системы — Opus 4.6 и GPT 5.4 — выходят на 25–28% против эталонного результата людей в 51%. Особенно показателен внутренний бенчмарк Anthropic на оптимизацию обучения CPU-only LLM: Opus 4 в мае 2025 ускорял базовый код в 2,9 раза, через год Claude Mythos Preview — в 52 раза, тогда как человеку для ускорения в 4 раза, по оценке Anthropic, нужно 4–8 часов работы.

Главный логический ход эссе — Кларк оспаривает предположение, что для самообучения ИИ нужны творческие прорывы уровня изобретения трансформера. По его мнению, прогресс в области ИИ — это в основном неприглядная инженерная работа: методичное масштабирование, отладка, перебор параметров. И именно в этом ИИ уже силен. Кларк цитирует Эдисона: "Гений — это 1% вдохновения и 99% пота". Отдельно он отмечает редкие признаки творчества у моделей — задачи Эрдёша, решенные GPT-5.4 Pro и системой Aletheia на базе Gemini, и математические доказательства, написанные совместно с инструментами Google DeepMind, — но полагает их пока недостаточными для трансформирующего эффекта.

Параллельно Кларк обращает внимание, что индустрия открыто декларирует автоматизацию ИИ-исследований как цель: OpenAI планирует "автономного ИИ-стажера" к сентябрю 2026, Anthropic публикует работы по автоматизированным исследователям выравнивания (alignment), стартап-компания Recursive Superintelligence поднял $500 млн именно под эту задачу. Основной риск, который выделяет Кларк, — проблема накапливающихся ошибок в рекурсивном цикле: даже 99,9% точности выравнивания после 500 поколений превращаются в 60,5%. Если к концу 2028 года автономный ИИ-R&D так и не появится, с точки зрения Кларка, это будет означать фундаментальный баг текущей технологии, и для движения вперед понадобятся прорывные идеи от людей.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

HPE предлагает год бесплатного программного обеспечения, чтобы переманить клиентов VMware

2 часа назад

HPE предлагает год бесплатного программного обеспечения, чтобы переманить клиентов VMware

На мероприятии HPE Discover в Лас-Вегасе компания Hewlett Packard Enterprise (HPE) объявила, что клиенты могут до одного года бесплатно пользоваться предложением «HPE Morpheus Software — VM Essentials

4 часа назад

Apple разрешила сторонние магазины приложений и альтернативные платёжные системы в Бразилии после требования регулятора

Apple разрешила разработчикам приложений для устройств под управлением iOS в Бразилии распространять их через авторизованные альтернативные маркетплейсы и применять сторонние платёжные системы. Измене

4 часа назад

Adobe внедрит ИИ-ассистента в Premiere Pro, Photoshop, Illustrator и InDesign — с поддержкой ChatGPT, Claude и Copilot

Adobe анонсировала масштабное расширение ИИ‑ассистента на своих продуктах Premiere Pro, Illustrator и InDesign. Ранее функция была доступна только в Express, Photoshop и Acrobat. Читать далее

Переговоры по Fable 5 сдвинулись: Белый дом и Anthropic вырабатывают стандарт безопасности ИИ

5 часов назад

Переговоры по Fable 5 сдвинулись: Белый дом и Anthropic вырабатывают стандарт безопасности ИИ

Белый дом и Anthropic совместно работают над методикой, которая позволит оценивать серьезность уязвимостей в новых ИИ-моделях и определять, когда государство вправе вмешаться. Об этом сообщает Politic

Alibaba представила Qwen-Robot Suite — набор AI-моделей для роботов и физических агентов

5 часов назад

Alibaba представила Qwen-Robot Suite — набор AI-моделей для роботов и физических агентов

Инженеры Alibaba представили Qwen-Robot Suite — набор из трёх фундаментальных AI-моделей для роботов и агентов, которые не только понимают текст и изображения, но и могут действовать в физическом мире