1 час назад
Самообучающийся ИИ может появиться в конце 2028 года — сооснователь Anthropic

Джек Кларк, сооснователь Anthropic и автор рассылки Import AI, опубликовал эссе с прогнозом: вероятность того, что к концу 2028 года появится ИИ-система, способная автономно обучить своего преемника без участия человека, составляет 60 процентов+. Для 2027 года Кларк оценивает ту же вероятность в 30 процентов.
В эссе используется термин "no-human-involved AI R&D" — модель, в достаточной степени мощная, чтобы самостоятельно создать следующую версию самой себя. Сам автор несколько нервничает по этому поводу: "Я не знаю, как уложить это в голове. Если это случится, мы пересечем Рубикон в почти невозможное для прогнозирования будущее". Кларк подчеркивает, что выводы основаны не на инсайдерской информации Anthropic, а на анализе публичных источников — arXiv, bioRxiv, NBER и продуктов фронтирных компаний.
Аргумент собран как мозаика из десятков бенчмарков — Кларк сознательно отказывается от ставки на одну метрику. SWE-Bench, известный проверка на решение реальных GitHub-задач, в 2023 году давал Claude 2 итог около 2%, а в 2026-м Claude Mythos Preview — 93,9%, фактически насыщая бенчмарк. Длительность задач, с которыми ИИ справляется автономно, по горизонту METR росла так: 30 секунд у GPT-3.5 в 2022, 4 минуты у GPT-4 в 2023, 40 минут у o1 в 2024, около 6 часов у GPT 5.2 (High) в 2025, около 12 часов у Opus 4.6 в 2026.
Главное в эссе — рост на бенчмарках, напрямую связанных с автоматизацией ИИ-исследований. CORE-Bench, тест на воспроизведение вычислительных результатов научных статей, прошел путь с 21,5% у GPT-4o с агентной обвязкой в сентябре 2024 до 95,5% у Opus 4.5 в декабре 2025 — один из авторов бенчмарка публично объявил его решенным. На MLE-Bench, где ИИ автономно участвует в 75 Kaggle-соревнованиях, итог вырос с 16,9% у o1 в октябре 2024 до 64,4% у Gemini 3 в феврале 2026. На PostTrainBench, проверяющем способность фронтирных моделей дообучать слабые модели с открытыми весами, топовые системы — Opus 4.6 и GPT 5.4 — выходят на 25–28% против эталонного результата людей в 51%. Особенно показателен внутренний бенчмарк Anthropic на оптимизацию обучения CPU-only LLM: Opus 4 в мае 2025 ускорял базовый код в 2,9 раза, через год Claude Mythos Preview — в 52 раза, тогда как человеку для ускорения в 4 раза, по оценке Anthropic, нужно 4–8 часов работы.
Главный логический ход эссе — Кларк оспаривает предположение, что для самообучения ИИ нужны творческие прорывы уровня изобретения трансформера. По его мнению, прогресс в области ИИ — это в основном неприглядная инженерная работа: методичное масштабирование, отладка, перебор параметров. И именно в этом ИИ уже силен. Кларк цитирует Эдисона: "Гений — это 1% вдохновения и 99% пота". Отдельно он отмечает редкие признаки творчества у моделей — задачи Эрдёша, решенные GPT-5.4 Pro и системой Aletheia на базе Gemini, и математические доказательства, написанные совместно с инструментами Google DeepMind, — но полагает их пока недостаточными для трансформирующего эффекта.
Параллельно Кларк обращает внимание, что индустрия открыто декларирует автоматизацию ИИ-исследований как цель: OpenAI планирует "автономного ИИ-стажера" к сентябрю 2026, Anthropic публикует работы по автоматизированным исследователям выравнивания (alignment), стартап-компания Recursive Superintelligence поднял $500 млн именно под эту задачу. Основной риск, который выделяет Кларк, — проблема накапливающихся ошибок в рекурсивном цикле: даже 99,9% точности выравнивания после 500 поколений превращаются в 60,5%. Если к концу 2028 года автономный ИИ-R&D так и не появится, с точки зрения Кларка, это будет означать фундаментальный баг текущей технологии, и для движения вперед понадобятся прорывные идеи от людей.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

1 час назад
В России буду следить за молодёжью в социальных сетях (от 14 до 35 лет)
В России утвердили комплекс мер по профилактике деструктивного поведения молодёжи до 2030 года. Если коротко, в документе 41 ивент: мониторинг активности в интернете, всероссийские конференции и семин

1 час назад
MIG A65 на «Ред ОС М» стал доступен в рознице
Организация Mobile Inform Group начала продажи смартфона MIG A65 с мобильной операционной системой «Ред ОС М» в розничном сегменте. Девайс будет доступно во всех розничных каналах, в том числе крупные

1 час назад
«Станете самыми ненавистными людьми в США»: Маск угрожал директору OpenAI перед судом
За двое суток до начала процесса против OpenAI Илон Маск создал текст президенту компании Грегу Брокману и пригрозил, что они с гендиректором Сэмом Альтманом станут "самыми ненавистными людьми в Амери

1 час назад
Операторы сообщили об отключении интернета и SMS в Москве и Санкт-Петербурге с 5 по 9 мая
Несколько мобильных операторов предупредили абонентов о возможных ограничениях мобильного интернета и сервиса SMS в Москве, Московской области и Санкт-Петербурге в период с 5 по 9 мая. Соответствующие

4 часа назад
Учёные разработали новые антитела против вируса, которым заражены 95% людей
Вирус Эпштейна — Барр (ВЭБ) — один из самых распространённых в мире; считается, что он присутствует в организме 95% взрослых. У большинства людей он не вызывает явных симптомов. Однако ВЭБ — это не пр