Андрей Карпати показал ИИ-исследователя — он проводит до 12 экспериментов в час

2 мин
Андрей Карпати показал ИИ-исследователя — он проводит до 12 экспериментов в час

Основатель Eureka Labs, бывший директор по ИИ в Tesla и один из основателей OpenAI Андрей Карпати выложил в публичный доступ проект autoresearch — систему, в которой ИИ-агент автономно проводит эксперименты по обучению языковых моделей на одном GPU. Агент сам модифицирует исходник, запускает пятиминутный цикл обучения, проверяет метрику качества и решает — сохранить изменения или откатить. Затем цикл повторяется. За час набирается приблизительно 12 экспериментов, за ночь — до сотни.

Главная идея проекта — человек больше не пишет Python-код как обычный исследователь. Вместо этого он редактирует Markdown-файл program.md — по существу, инструкцию для агента: что пробовать, как оценивать результат, когда откатываться. Агент же итерирует единственный файл train.py (~630 строк), в котором собрана архитектура GPT, оптимизаторы Muon и AdamW и весь тренировочный цикл. Метрика — val_bpb (биты на байт на валидации) — не зависит от размера словаря, поэтому эксперименты сопоставимы даже при замене архитектуры.

Каждый эксперимент длится ровно 5 минут — независимо от того, что именно поменял агент: размер модели, батч, гиперпараметры или архитектуру целиком. Это делает результаты сопоставимыми между собой, хотя и привязывает их к конкретному GPU (инициатива тестировался на H100).

Карпати предложил смотреть на проект как на соревнование: кто напишет лучший program.md — тот добьется самого быстрого исследовательского прогресса. А в эпиграфе к репозиторию пошутил, что эра «мясных компьютеров», которые синхронизировались звуковыми волнами на «групповых совещаниях», давно прошла — теперь исследования ведут автономные рои агентов.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

GPT-5.5 возглавила рейтинг сильнейших ИИ с тревожной оговоркой

2 часа назад

GPT-5.5 возглавила рейтинг сильнейших ИИ с тревожной оговоркой

Artificial Analysis поставила GPT-5.5 на первое место в своем Intelligence Index. По оценке компании, новая модель OpenAI обошла ближайших конкурентов на 3 пункта и прервала ничью между OpenAI, Anthro

Intel показала прототип ноутбука на базе чипа Wildcat Lake, который должен стать конкурентом MacBook Neo

2 часа назад

Intel показала прототип ноутбука на базе чипа Wildcat Lake, который должен стать конкурентом MacBook Neo

Intel представила журналистам прототип ноутбука на базе чипа Wildcat Lake. Компания делает упор на компактность, энергоэффективность и планирует конкурировать с MacBook Neo. Ознакомиться далее

DJI представила дроны Lito 1 и X1 с запись 4K HDR для начинающих пилотов

4 часа назад

DJI представила дроны Lito 1 и X1 с запись 4K HDR для начинающих пилотов

DJI анонсировала линейку дронов Lito, предназначенных для начинающих пилотов. Линейка состоит из двух дронов, которые различаются камерами. Цены в Европе начинаются от 350 евро. Читать далее

Tencent запустила тестирование ИИ-агента QClaw, но сильно ограничила к нему доступ

5 часов назад

Tencent запустила тестирование ИИ-агента QClaw, но сильно ограничила к нему доступ

Tencent запустила публичный бета-тест собственного ИИ-агента QClaw для пользователей по всему миру — приложение работает на Windows и Mac без сложной технической настройки, тем не менее на старте дост

OpenAI представили свежий флагман — GPT-5.5

5 часов назад

OpenAI представили свежий флагман — GPT-5.5

OpenAI выпустила GPT-5.5 — свежий флагман, который, по заявлению компании, помог оптимизировать собственный инференс-стек. В соответствии с заявлению компании, GPT-5.5 в кодинг-агенте Codex оптимизиро