Андрей Карпати показал ИИ-исследователя — он проводит до 12 экспериментов в час

2 мин
Андрей Карпати показал ИИ-исследователя — он проводит до 12 экспериментов в час

Основатель Eureka Labs, бывший директор по ИИ в Tesla и один из основателей OpenAI Андрей Карпати выложил в публичный доступ проект autoresearch — систему, в которой ИИ-агент автономно проводит эксперименты по обучению языковых моделей на одном GPU. Агент сам модифицирует исходник, запускает пятиминутный цикл обучения, проверяет метрику качества и решает — сохранить изменения или откатить. Затем цикл повторяется. За час набирается приблизительно 12 экспериментов, за ночь — до сотни.

Главная идея проекта — человек больше не пишет Python-код как обычный исследователь. Вместо этого он редактирует Markdown-файл program.md — по существу, инструкцию для агента: что пробовать, как оценивать результат, когда откатываться. Агент же итерирует единственный файл train.py (~630 строк), в котором собрана архитектура GPT, оптимизаторы Muon и AdamW и весь тренировочный цикл. Метрика — val_bpb (биты на байт на валидации) — не зависит от размера словаря, поэтому эксперименты сопоставимы даже при замене архитектуры.

Каждый эксперимент длится ровно 5 минут — независимо от того, что именно поменял агент: размер модели, батч, гиперпараметры или архитектуру целиком. Это делает результаты сопоставимыми между собой, хотя и привязывает их к конкретному GPU (инициатива тестировался на H100).

Карпати предложил смотреть на проект как на соревнование: кто напишет лучший program.md — тот добьется самого быстрого исследовательского прогресса. А в эпиграфе к репозиторию пошутил, что эра «мясных компьютеров», которые синхронизировались звуковыми волнами на «групповых совещаниях», давно прошла — теперь исследования ведут автономные рои агентов.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Росстандарт утвердил свежий ГОСТ на карандаши

24 минуты назад

Росстандарт утвердил свежий ГОСТ на карандаши

С 1 сентября 2026 года в России начнет действовать свежий ГОСТ на карандаши, говорится в новом документе Росстандарта. Ознакомиться далее

Россиянам стартовали приходить письма от фейковой налоговой с QR-кодами для оплаты «долга»

35 минут назад

Россиянам стартовали приходить письма от фейковой налоговой с QR-кодами для оплаты «долга»

Российским гражданам начали приходить электронные письма от фейковой Федеральной налоговой службы (ФНС) с требованиями оплатить налоги и QR-кодами, которые ведут на фишинговые сайты. Об этом рассказал

Microsoft представила Copilot Cowork – ИИ-агента для 365 на основе технологий Anthropic

41 минуту назад

Microsoft представила Copilot Cowork – ИИ-агента для 365 на основе технологий Anthropic

Microsoft объявила о запуске Copilot Cowork – нового облачного решения на основе ИИ, интегрированного в пакет Microsoft 365. Продукт разработан при участии компании Anthropic и использует технологии,

44 минуты назад

Путин подписал закон об извещении граждан о поиске родственниками или другими лицами через «Госуслуги»

Президент России подписал законопроект, в соответствии с которому граждане будут получать извещения от МВД через «Госуслуги» в том случае, если их ищут родные или другие лица. Документ опубликован на 

OpenAI покупает Promptfoo: стартап-компания, который ломает ИИ-приложения

50 минут назад

OpenAI покупает Promptfoo: стартап-компания, который ломает ИИ-приложения

OpenAI объявила о покупке Promptfoo — платформы для тестирования безопасности ИИ-систем, которой пользуются более 25% компаний из Fortune 500. Инструменты стартапа будут интегрированы в OpenAI Frontie