8 марта 2026, 16:55

Андрей Карпати показал ИИ-исследователя — он проводит до 12 экспериментов в час

2 мин

Основатель Eureka Labs, бывший директор по ИИ в Tesla и один из основателей OpenAI Андрей Карпати выложил в публичный доступ проект autoresearch — систему, в которой ИИ-агент автономно проводит эксперименты по обучению языковых моделей на одном GPU. Агент сам модифицирует исходник, запускает пятиминутный цикл обучения, проверяет метрику качества и решает — сохранить изменения или откатить. Затем цикл повторяется. За час набирается приблизительно 12 экспериментов, за ночь — до сотни.

Главная идея проекта — человек больше не пишет Python-код как обычный исследователь. Вместо этого он редактирует Markdown-файл program.md — по существу, инструкцию для агента: что пробовать, как оценивать результат, когда откатываться. Агент же итерирует единственный файл train.py (~630 строк), в котором собрана архитектура GPT, оптимизаторы Muon и AdamW и весь тренировочный цикл. Метрика — val_bpb (биты на байт на валидации) — не зависит от размера словаря, поэтому эксперименты сопоставимы даже при замене архитектуры.

Каждый эксперимент длится ровно 5 минут — независимо от того, что именно поменял агент: размер модели, батч, гиперпараметры или архитектуру целиком. Это делает результаты сопоставимыми между собой, хотя и привязывает их к конкретному GPU (инициатива тестировался на H100).

Карпати предложил смотреть на проект как на соревнование: кто напишет лучший program.md — тот добьется самого быстрого исследовательского прогресса. А в эпиграфе к репозиторию пошутил, что эра «мясных компьютеров», которые синхронизировались звуковыми волнами на «групповых совещаниях», давно прошла — теперь исследования ведут автономные рои агентов.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

карпати

Читают сейчас

46 минут назад

Вышел Visual Studio Code 1.130: отдельный процедура для ИИ-агентов и упрощённая тест правок

Microsoft выпустила Visual Studio Code 1.130. Основные изменения затронули работу с ИИ-агентами: их сессии постепенно переносят в отдельный процедура, а оболочку просмотра сгенерированных изменений сд

1 час назад

Датамайнеры обнаружили эмулятор Xbox 360, скрытый в контексте обратной совместимости оригинальной Xbox с ПК

Во второй половине июля Microsoft объявила о запуске программы обратной совместимости Xbox Backward Compatibility on PC, которая позволяет запускать игры с оригинальной Xbox на ПК и портативных устрой

1 час назад

OpenAI сделала ChatGPT Health доступным для всех пользователей в США

OpenAI объявила о полном запуске сервиса ChatGPT Health в США. Теперь воспользоваться им могут все авторизованные пользователи старше 18 лет нев зависимости от тарифа — Free, Go, Plus или Pro. Функция

1 час назад

Selectel дарит домены новым клиентам VDS

При аренде VDS в Selectel до 30 сентября 2026 года все новые клиенты могут получить в подарок адрес сайта в зоне .ru или .рф. Подробности под катом. Читать далее

1 час назад

Евросоюз ввёл санкции против банков WB, Ozon, «Яндекса», МТС и десятков других финансовых организаций

Евросоюз согласовал и утвердил 21-й пакет санкций против России, они коснутся сфер финансов, энергетики, торговли и криптовалюты, заявил глава Европейского совета Антониу Кошта. В соответствии с публи