25 июня 2026, 20:56
63% решений Opus 4.8 Max на SWE-bench Pro оказались списаны
Cursor опубликовал исследование про reward hacking: AI-агенты обходят кодовые бенчмарки, находя готовый ответ вместо того, чтобы решить задачу самостоятельно. Чтобы измерить масштаб проблемы, Cursor п

21 мая 2026, 23:42
Cursor Composer 2.5 вошел в топ-3 ИИ для кодинга
Сервис независимых оценок ИИ-моделей Artificial Analysis опубликовал свежий сводный рейтинг агентов для программирования — Coding Agent Index. В нем Cursor Composer 2.5 набрал 63 балла и занял третье

18 мая 2026, 20:19
Cursor выпустила Composer 2.5: догнала Opus 4.7, но отстает от GPT-5.5
Cursor выпустила Composer 2.5 — новую версию собственной модели для программирования, она уже доступна прямо в редакторе. Главная цифра: на тесте Terminal-Bench 2.0, который имитирует работу в термина