Composer тренирует Composer: Cursor использовал старую схема для обучения новой

2 мин
Composer тренирует Composer: Cursor использовал старую схема для обучения новой

Cursor рассказал в блоге о механизме autoinstall, который помог поднять собственную модель Composer 2 на бенчмарке Terminal-Bench с 47,9% до 61,7%. Главная идея: предыдущая релиз модели, Composer 1.5, автоматически готовила рабочие окружения, на которых потом обучалась Composer 2.

Чтобы тренировать модель для программирования через обучение с подкреплением (RL), нужны рабочие программные проекты: репозиторий должен запускаться, зависимости — устанавливаться, тесты — проходить. Если окружение сломано на старте, схема тратит токены и вычисления не на решение задачи, а на отладку установки. Иногда проблема и вовсе становится нерешаемой, и обучающий сигнал теряется. То есть проблема не в том, чтобы научить модель писать исходник, а в том, чтобы каждая учебная проблема была корректной и работающей.

Autoinstall устроен в две стадии. На первой стадии агент получает голую копию репозитория, изучает README, makefile, документацию проекта и предлагает десять команд, которые должны успешно выполниться при правильной настройке: установка пакетов, тесты, запускание исполняемых частей. На второй стадии — еще один экземпляр Composer берет три команды из этого списка и доводит проект до состояния, в котором они успешно выполняются. Если итоговая проверка не срабатывает, стадию перезапускают; после пяти неудачных попыток окружение отбрасывают.

Объем работы шире обычного "поставь пакет — запусти тест". По описанию Cursor, autoinstall может создавать недостающие файлы и изображения-заглушки, мокать таблицы базы данных и S3-папки, поднимать конфигурации MinIO и контейнеры Docker, писать стартовые скрипты для долгоживущих процессов. В качестве иллюстрации компания приводит работу с celo-org/celo-monorepo — большим блокчейн-проектом с неполной документацией. Агент изучал внешнюю документацию через веб-поиск, обнаружил необходимость в Foundry и связанном репозитории, со следующий попытки разработал мок-пользователя и сумел запустить демонстрационную программу локально.

Cursor осторожен в выводах. Это не история о том, как модель создала следующую схема — Composer 1.5 не разрабатывала Composer 2, она только автоматизировала часть инфраструктурного конвейера. Но организация пишет, что в будущих тренировочных циклах предыдущие версии Composer могут взять на себя и другие части обучения: управление запусками, препроцессинг данных, настройку архитектуры. Постепенный сдвиг к конвейеру, где старшее поколение моделей обслуживает производство младшего.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Вышло апдейт открытого проекта DPI Detector 3.3.0

29 минут назад

Вышло апдейт открытого проекта DPI Detector 3.3.0

7 мая 2026 года состоялся выпуск обновления открытого проекта DPI Detector 3.3.0. Это Средство для анализа цензуры трафика в РФ, который обнаруживает и классифицирует блокировки сайтов, хостингов и CD

Вышла Unix-подобная операционная платформа ToaruOS 2.3

2 часа назад

Вышла Unix-подобная операционная платформа ToaruOS 2.3

Представлено обновление Unix‑подобной операционной системы ToaruOS 2.3. Решение создано с нуля и поставляется со своим ядром, загрузчиком, стандартной С‑библиотекой, пакетным менеджером, компонентами

Выпуск открытого каталогизатора домашней библиотеки MyLibrary 5.0

2 часа назад

Выпуск открытого каталогизатора домашней библиотеки MyLibrary 5.0

5 мая 2026 года состоялся выпуск открытого каталогизатора домашней библиотеки MyLibrary 5.0. Программа адаптирована для работы в операционных системах семейства Linux и Windows. Для пользователей Arch

Конец независимости DeepSeek: лаборатория Ляна Вэньфэна идет за деньгами

8 часов назад

Конец независимости DeepSeek: лаборатория Ляна Вэньфэна идет за деньгами

Организация, которая годами отказывалась от внешних инвесторов и финансировалась за счет квантового хедж-фонда, готовится привлечь внешний капитал. По данным Reuters и Financial Times, DeepSeek ведет

Meta* с помощью ИИ-сканирования будет выявлять аккаунты детей в Facebook** и Instagram**

8 часов назад

Meta* с помощью ИИ-сканирования будет выявлять аккаунты детей в Facebook** и Instagram**

Meta* внедряет систему на основе искусственного интеллекта, которая будет применять сочетание текстового анализа и визуального сканирования для определения и блокировки аккаунтов Facebook** и Instagra