Composer тренирует Composer: Cursor использовал старую схема для обучения новой

2 мин
Composer тренирует Composer: Cursor использовал старую схема для обучения новой

Cursor рассказал в блоге о механизме autoinstall, который помог поднять собственную модель Composer 2 на бенчмарке Terminal-Bench с 47,9% до 61,7%. Главная идея: предыдущая релиз модели, Composer 1.5, автоматически готовила рабочие окружения, на которых потом обучалась Composer 2.

Чтобы тренировать модель для программирования через обучение с подкреплением (RL), нужны рабочие программные проекты: репозиторий должен запускаться, зависимости — устанавливаться, тесты — проходить. Если окружение сломано на старте, схема тратит токены и вычисления не на решение задачи, а на отладку установки. Иногда проблема и вовсе становится нерешаемой, и обучающий сигнал теряется. То есть проблема не в том, чтобы научить модель писать исходник, а в том, чтобы каждая учебная проблема была корректной и работающей.

Autoinstall устроен в две стадии. На первой стадии агент получает голую копию репозитория, изучает README, makefile, документацию проекта и предлагает десять команд, которые должны успешно выполниться при правильной настройке: установка пакетов, тесты, запускание исполняемых частей. На второй стадии — еще один экземпляр Composer берет три команды из этого списка и доводит проект до состояния, в котором они успешно выполняются. Если итоговая проверка не срабатывает, стадию перезапускают; после пяти неудачных попыток окружение отбрасывают.

Объем работы шире обычного "поставь пакет — запусти тест". По описанию Cursor, autoinstall может создавать недостающие файлы и изображения-заглушки, мокать таблицы базы данных и S3-папки, поднимать конфигурации MinIO и контейнеры Docker, писать стартовые скрипты для долгоживущих процессов. В качестве иллюстрации компания приводит работу с celo-org/celo-monorepo — большим блокчейн-проектом с неполной документацией. Агент изучал внешнюю документацию через веб-поиск, обнаружил необходимость в Foundry и связанном репозитории, со следующий попытки разработал мок-пользователя и сумел запустить демонстрационную программу локально.

Cursor осторожен в выводах. Это не история о том, как модель создала следующую схема — Composer 1.5 не разрабатывала Composer 2, она только автоматизировала часть инфраструктурного конвейера. Но организация пишет, что в будущих тренировочных циклах предыдущие версии Composer могут взять на себя и другие части обучения: управление запусками, препроцессинг данных, настройку архитектуры. Постепенный сдвиг к конвейеру, где старшее поколение моделей обслуживает производство младшего.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

AEON выпустит одноплатный компьютер для создания встраиваемых систем

14 минут назад

AEON выпустит одноплатный компьютер для создания встраиваемых систем

Организация AAEON представит одноплатный компьютер UP WCL для создания встраиваемых систем и периферийных устройств с ИИ-функциями. Он работает на аппаратной платформе Intel Wildcat Lake с Windows 11

Вышла стабильная релиз systemd 261

21 минуту назад

Вышла стабильная релиз systemd 261

19 июня 2026 года состоялся релиз стабильной версии подсистемы инициализации и управления службами в Linux systemd 261. Ознакомиться далее

Свежий медиаплеер Windows 11 потребляет в 3,5 раза больше памяти и требует платы за видеокодеки

34 минуты назад

Свежий медиаплеер Windows 11 потребляет в 3,5 раза больше памяти и требует платы за видеокодеки

Свежий медиаплеер Microsoft для Windows 11 раскритиковали за то, что он использует гораздо больше памяти, чем классический Windows Media Player. Кроме того, он скрывает некоторые популярные кодеки за

Владельцы Google Pixel 10 Pro XL и Pixel 10 Pro Fold столкнулись с багом в Gmail

55 минут назад

Владельцы Google Pixel 10 Pro XL и Pixel 10 Pro Fold столкнулись с багом в Gmail

В последних флагманских смартфонах Google Pixel обнаружили программную ошибку, которая нарушает работу приложения Gmail. Читать далее

Самоучка с Claude Code объявил, что расшифровал минойское письмо, не поддававшееся 120 лет

1 час назад

Самоучка с Claude Code объявил, что расшифровал минойское письмо, не поддававшееся 120 лет

Том Ди Мино — инженер-самоучка и лингвист-любитель из долины Гудзона — объявил, что расшифровал линейное письмо А, минойскую письменность бронзового века, над которой специалисты безуспешно бьются бол