Cursor Composer 2.5 вошел в топ-3 ИИ для кодинга

2 мин
Cursor Composer 2.5 вошел в топ-3 ИИ для кодинга

Сервис независимых оценок ИИ-моделей Artificial Analysis опубликовал новый сводный рейтинг агентов для программирования — Coding Agent Index. В нем Cursor Composer 2.5 набрал 63 балла и занял третье место. Выше только Claude Code с Opus 4.7 на максимальном режиме (67 баллов) и Codex с GPT-5.5 на режиме экстра-рассуждений (65). Все остальные участники — позади.

Главная цифра — даже не место, а цена. Composer 2.5 Fast обходится в 44 цента за задачу, тогда как Claude Code с Opus 4.7 — $4.14, а Codex с GPT-5.5 — $4.33. Это приблизительно в десять раз дешевле при сопоставимом качестве. Базовый вариант Composer 2.5 стоит и вовсе 7 центов за задачу — в 60 раз дешевле лидеров. Coding Agent Index считается как средний итог на трех тестах: SWE-Bench-Pro-Hard-AA (правка реальных багов в открытых проектах), Terminal-Bench v2 (работа в терминале) и SWE-Atlas-QnA (вопросы по большим кодовым базам). Composer 2.5 оказался самым дешевым агентом из всех, кто перевалил отметку в 60 баллов.

Наиболее интересный результат — на SWE-Bench-Pro-Hard-AA, который считается самым сложным из трех. Здесь Composer 2.5 Fast выбил 49% и обошел Claude Opus 4.7 Max (45%) и GPT-5.5 XHigh (31%). У предыдущей версии Composer 2 на этом же тесте было всего 12%. То есть Cursor подняла собственный метрика в четыре раза за один выпуск. На Terminal-Bench v2 увеличение скромнее — с 64% до 67%, на SWE-Atlas-QnA — с 69% до 72%. Но в общем и целом индексе скачок все равно солидный: с 48 до 63 баллов.

Базовая схема та же, что и у Composer 2 — открытая Kimi K2.5 от китайской Moonshot AI. Но Cursor отдельно отчиталась, что около 85% новой модели — собственное дообучение и обучение с подкреплением, когда модель учат на наградах за удачные решения. У Composer 2.5 два варианта: стандартный по цене 50 центов и $2.50 за миллион входных и выходных токенов, и Fast — по $3 и $15. Это та же схема, но на более быстрой инфраструктуре: одна задача в среднем занимает 6.7 минуты против 9.3 у стандартного варианта.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

«Сбер» открыл в Москве свежий офис центра робототехники для развития Physical AI

2 часа назад

«Сбер» открыл в Москве свежий офис центра робототехники для развития Physical AI

Центр робототехники «Сбер» открыл новый офис в Москве. В соответствии с заявлению компании, пространство связано с развитием направления Physical AI. В офисе работают исследовательские, инженерные, пр

«Офисного работника придумала Microsoft, чтобы продавать софт»: глава Perplexity защитил ИИ-революцию

2 часа назад

«Офисного работника придумала Microsoft, чтобы продавать софт»: глава Perplexity защитил ИИ-революцию

Сооснователь и глава Perplexity Аравинд Шринивас пришел на подкаст Джо Рогана и заявил, что современная концепция офисного работника — конструкция, которую выстроила Microsoft, чтобы продавать корпора

3 часа назад

Наталья Касперская и Игорь Ашамов представили критику законопроекта Минцифры РФ «О поддержке развития ИИ»

Президент группы компаний InfoWatch Наталья Касперская и глава компании «Ашманов и партнёры» Игорь Ашманов подготовили разбор законопроекта Минцифры РФ «О поддержке развития ИИ». Ранее они уже анализи

Claude Fable 5 портировал Command & Conquer: Generals на iPhone

5 часов назад

Claude Fable 5 портировал Command & Conquer: Generals на iPhone

Аммаар Реши, руководитель продукта и дизайна Google AI Studio, запустил классическую стратегию Command & Conquer: Generals — Zero Hour 2003 года нативно на iPhone и iPad. Почти всю инженерную работу в

5 часов назад

СМИ: «VK Tech и Yandex B2B Tech — сотрудничество в корпоративном сегменте ПО»

VK Tech и Yandex B2B Tech обсуждают возможное партнёрство в корпоративном сегменте программного обеспечения. Об этом сообщили «Ведомости» со ссылкой на два неизвестных источника. По их данным, речь ид