Cursor ускоряет regex-поиск по коду для ИИ-агентов

2 мин
Cursor ускоряет regex-поиск по коду для ИИ-агентов

Компания Cursor рассказала о подходе к ускорению поиска по регулярным выражениям в больших кодовых базах. Речь идет о задаче, которая становится все важнее на фоне распространения ИИ-агентов для программирования. Такие системы постоянно ищут по проекту функции, сигнатуры, конфигурации и другие точные текстовые совпадения, а в крупных монорепозиториях это превращается в заметное узкое место.

По данным Cursor, в больших репозиториях обычный поиск через ripgrep в отдельных случаях может занимать более 15 секунд. Для разработчика это означает паузу в работе, а для ИИ-агента - дополнительную задержку при каждом обращении к коду. Поэтому организация решила ускорить не только сами модели, но и базовую инфраструктуру поиска.

В основе нового подхода лежит локальная индексация. Вместо того чтобы каждый раз заново просматривать всю кодовую базу, Cursor предлагает заранее строить индекс на компьютере пользователя и применять его для предварительного отбора файлов, где совпадение действительно вероятно. После этого система запускает уже обычную проверку регулярным выражением, но не по всему проекту, а по более узкому набору кандидатов.

Для такой фильтрации Cursor использует триграммы - последовательности из трех символов. Это популярный подход из систем поиска по тексту и коду, который позволяет быстро определить, в каких документах потенциально может встретиться необходимый шаблон. В компании отмечают, что одних триграмм для больших проектов нев достаточной степени, следовательно дополнительно применяются более сложные методы отбора, в том числе sparse n-grams - «разреженные n-граммы» и вероятностные маски. Их задача уменьшить число лишних совпадений и сократить объем файлов, которые все же придется читать полностью.

Cursor подчеркивает, что индексы будут храниться и использоваться локально. Такой вариант должен снизить задержки, уменьшить зависимость от сети и упростить работу с быстро меняющимся кодом, который агент только что отредактировал. Для больших репозиториев это особенно важно: индекс должен быть максимально свежим, иначе выигрыш в скорости быстро исчезает.

Итак, Cursor делает ставку не только на развитие ИИ-моделей, но и на ускорение самых частых операций под капотом. Организация практически демонстрирует, что в AI IDE эффективность зависит не только от качества генерации, но и от того, насколько быстро платформа находит необходимый контекст в проекте.

Короче говоря, Cursor рассматривает оперативный regex-поиск как один из ключевых элементов следующего поколения инструментов разработки. И в этом смысле речь идет о довольно прикладной инженерной задаче: сократить время между запросом агента и полезным ответом.

Источник: Cursor

Читают сейчас

Huawei Atlas 350 — конкурент NVIDIA или нишевый продукт? Новости из Поднебесной

9 минут назад

Huawei Atlas 350 — конкурент NVIDIA или нишевый продукт? Новости из Поднебесной

Едва NVIDIA показали новую RTX Pro 4500 Blackwell Server Edition, как китайский вендор Huawei на мероприятии Huawei China Partner Conference показывает новинку — ускоритель Huawei Atlas 350. Об этой н

Windows 11 получит компактную панель задач подобно Windows 10

20 минут назад

Windows 11 получит компактную панель задач подобно Windows 10

Microsoft вернёт в Windows 11 компактную панель задач, похожую на Windows 10, с возможностью изменения размера. Читать далее

90% репозиториев с Claude Code имеют меньше 2 звезд. Это задача или новая норма?

33 минуты назад

90% репозиториев с Claude Code имеют меньше 2 звезд. Это задача или новая норма?

Независимый дашборд claudescode.dev, отслеживающий все публичные коммиты с тегом Claude Code на GitHub, насчитал более 20 млн коммитов в 1,08 млн репозиториев за год с момента запуска инструмента. Но

Инициатива Минцифры об инвестициях IT-компаний в образование вызвал разногласия

34 минуты назад

Инициатива Минцифры об инвестициях IT-компаний в образование вызвал разногласия

«Ъ» ознакомился с отзывами участников рынка на обновлённый инициатива приказа Минцифры, устанавливающий порядок взаимодействия IT‑компаний и образовательных организаций. Документ, опубликованный 20 фе

Sonova планирует продать подразделение Sennheiser по производству наушников

39 минут назад

Sonova планирует продать подразделение Sennheiser по производству наушников

Швейцарский производитель слуховых аппаратов Sonova планирует продать потребительское подразделение немецкой Sennheiser в рамках масштабной реструктуризации рыночной стратегии. Sonova намерена сосредо