1 час назад
Cursor Composer 2.5 вошел в топ-3 ИИ для кодинга

Сервис независимых оценок ИИ-моделей Artificial Analysis опубликовал новый сводный рейтинг агентов для программирования — Coding Agent Index. В нем Cursor Composer 2.5 набрал 63 балла и занял третье место. Выше только Claude Code с Opus 4.7 на максимальном режиме (67 баллов) и Codex с GPT-5.5 на режиме экстра-рассуждений (65). Все остальные участники — позади.
Главная цифра — даже не место, а цена. Composer 2.5 Fast обходится в 44 цента за задачу, тогда как Claude Code с Opus 4.7 — $4.14, а Codex с GPT-5.5 — $4.33. Это приблизительно в десять раз дешевле при сопоставимом качестве. Базовый вариант Composer 2.5 стоит и вовсе 7 центов за задачу — в 60 раз дешевле лидеров. Coding Agent Index считается как средний итог на трех тестах: SWE-Bench-Pro-Hard-AA (правка реальных багов в открытых проектах), Terminal-Bench v2 (работа в терминале) и SWE-Atlas-QnA (вопросы по большим кодовым базам). Composer 2.5 оказался самым дешевым агентом из всех, кто перевалил отметку в 60 баллов.
Наиболее интересный результат — на SWE-Bench-Pro-Hard-AA, который считается самым сложным из трех. Здесь Composer 2.5 Fast выбил 49% и обошел Claude Opus 4.7 Max (45%) и GPT-5.5 XHigh (31%). У предыдущей версии Composer 2 на этом же тесте было всего 12%. То есть Cursor подняла собственный метрика в четыре раза за один выпуск. На Terminal-Bench v2 увеличение скромнее — с 64% до 67%, на SWE-Atlas-QnA — с 69% до 72%. Но в общем и целом индексе скачок все равно солидный: с 48 до 63 баллов.
Базовая схема та же, что и у Composer 2 — открытая Kimi K2.5 от китайской Moonshot AI. Но Cursor отдельно отчиталась, что около 85% новой модели — собственное дообучение и обучение с подкреплением, когда модель учат на наградах за удачные решения. У Composer 2.5 два варианта: стандартный по цене 50 центов и $2.50 за миллион входных и выходных токенов, и Fast — по $3 и $15. Это та же схема, но на более быстрой инфраструктуре: одна задача в среднем занимает 6.7 минуты против 9.3 у стандартного варианта.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

1 час назад
Microsoft опенсорснула RAMPART — каркас безопасности ИИ-агентов
Microsoft выложила в открытый доступ два инструмента для разработчиков ИИ-агентов — RAMPART и Clarity. Первый встраивает тестирование безопасности прямо в CI-пайплайн, второй помогает продумать архите

1 час назад
Прототипы космических детекторов нейтрино отправляются на орбиту
Нейтрино, вторые по распространённости фундаментальные частицы во Вселенной, известны тем, что их крайне сложно обнаружить. До сих пор это удавалось сделать только путём создания гигантских резервуаро
1 час назад
Фонд Викимедиа увольняет инженеров, отвечающих за работу с пожеланиями пользователей
20 мая Сай Суман Черукувада, заместитель директора Фонда Викимедиа (организации, поддерживающей инфраструктуру Википедии) по продуктам и технологиям, заявил о роспуске команды, отвечающей за работу с
3 часа назад
В США создали спецподразделение для внедрения ИИ в военные операции
Киберкомандование США сформировало специальное подразделение для изучения и освоения ИИ‑инструментов с продвинутыми хакерскими возможностями, говорит Politico со ссылкой на источники. Читать далее

3 часа назад
Apple отчиталась о работе службы безопасности магазина приложений App Store в 2025 году
Apple опубликовала отчёт о работе службы безопасности магазина приложений App Store — организация поделилась показателями за 2025 год. Ознакомиться далее