Андрей Карпати показал ИИ-исследователя — он проводит до 12 экспериментов в час

2 мин
Андрей Карпати показал ИИ-исследователя — он проводит до 12 экспериментов в час

Основатель Eureka Labs, бывший директор по ИИ в Tesla и один из основателей OpenAI Андрей Карпати выложил в публичный доступ проект autoresearch — систему, в которой ИИ-агент автономно проводит эксперименты по обучению языковых моделей на одном GPU. Агент сам модифицирует исходник, запускает пятиминутный цикл обучения, проверяет метрику качества и решает — сохранить изменения или откатить. Затем цикл повторяется. За час набирается приблизительно 12 экспериментов, за ночь — до сотни.

Главная идея проекта — человек больше не пишет Python-код как обычный исследователь. Вместо этого он редактирует Markdown-файл program.md — по существу, инструкцию для агента: что пробовать, как оценивать результат, когда откатываться. Агент же итерирует единственный файл train.py (~630 строк), в котором собрана архитектура GPT, оптимизаторы Muon и AdamW и весь тренировочный цикл. Метрика — val_bpb (биты на байт на валидации) — не зависит от размера словаря, поэтому эксперименты сопоставимы даже при замене архитектуры.

Каждый эксперимент длится ровно 5 минут — независимо от того, что именно поменял агент: размер модели, батч, гиперпараметры или архитектуру целиком. Это делает результаты сопоставимыми между собой, хотя и привязывает их к конкретному GPU (инициатива тестировался на H100).

Карпати предложил смотреть на проект как на соревнование: кто напишет лучший program.md — тот добьется самого быстрого исследовательского прогресса. А в эпиграфе к репозиторию пошутил, что эра «мясных компьютеров», которые синхронизировались звуковыми волнами на «групповых совещаниях», давно прошла — теперь исследования ведут автономные рои агентов.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Открыл репозиторий в Claude Code — и ключи украдены: атака вырубила 73 репозитория Microsoft

30 минут назад

Открыл репозиторий в Claude Code — и ключи украдены: атака вырубила 73 репозитория Microsoft

5 июня неизвестные злоумышленники добавили вредоносный исходник в один из репозиториев Microsoft на GitHub — Azure/durabletask. Хитрость в том, что код срабатывает не при установке программы, а в моме

Версия открытого проекта для ведения заметок OutWiker 4.0

35 минут назад

Версия открытого проекта для ведения заметок OutWiker 4.0

Состоялся выпуск проекта для хранения заметок OutWiker 4.0. Предыдущая стабильная релиз проекта вышла в августе 2024 года. Исходный код решения написан на языке Python (интерфейс на wxPython) и опубли

Meta* признала и исправила проблему, в связи с которой любой мог завладеть чужим аккаунтом в Instagram

5 часов назад

Meta* признала и исправила проблему, в связи с которой любой мог завладеть чужим аккаунтом в Instagram

Организация Meta* признала и исправила проблему с безопасностью, из-за которой любой мог заставить чат-бота Meta* AI сбросить пароль в чужих аккаунтах Instagram** без двухфакторной аутентификации. Чит

Grok все? Google арендует у Маска вычислительные мощности на почти $1 млрд в месяц

10 часов назад

Grok все? Google арендует у Маска вычислительные мощности на почти $1 млрд в месяц

Google будет платить SpaceX $920 млн в месяц с октября 2026 по июнь 2029 за доступ около к 110 000 GPU NVIDIA, а равным образом к CPU, памяти и сопутствующей инфраструктуре. За цельный дедлайн это око

Версия обновления открытого эмулятора ZX Spectrum под названием Glukalka 3.1

12 часов назад

Версия обновления открытого эмулятора ZX Spectrum под названием Glukalka 3.1

Состоялся версия обновления открытого эмулятора ZX Spectrum под названием Glukalka 3.1. Версия 3.0 проекта вышла в 2024 году. Ознакомиться далее