Cursor ускоряет regex-поиск по коду для ИИ-агентов

2 мин
Cursor ускоряет regex-поиск по коду для ИИ-агентов

Компания Cursor рассказала о подходе к ускорению поиска по регулярным выражениям в больших кодовых базах. Речь идет о задаче, которая становится все важнее на фоне распространения ИИ-агентов для программирования. Такие системы постоянно ищут по проекту функции, сигнатуры, конфигурации и другие точные текстовые совпадения, а в крупных монорепозиториях это превращается в заметное узкое место.

По данным Cursor, в больших репозиториях обычный поиск через ripgrep в отдельных случаях может занимать более 15 секунд. Для разработчика это означает паузу в работе, а для ИИ-агента - дополнительную задержку при каждом обращении к коду. Поэтому организация решила ускорить не только сами модели, но и базовую инфраструктуру поиска.

В основе нового подхода лежит локальная индексация. Вместо того чтобы каждый раз заново просматривать всю кодовую базу, Cursor предлагает заранее строить индекс на компьютере пользователя и применять его для предварительного отбора файлов, где совпадение действительно вероятно. После этого система запускает уже обычную проверку регулярным выражением, но не по всему проекту, а по более узкому набору кандидатов.

Для такой фильтрации Cursor использует триграммы - последовательности из трех символов. Это популярный подход из систем поиска по тексту и коду, который позволяет быстро определить, в каких документах потенциально может встретиться необходимый шаблон. В компании отмечают, что одних триграмм для больших проектов нев достаточной степени, следовательно дополнительно применяются более сложные методы отбора, в том числе sparse n-grams - «разреженные n-граммы» и вероятностные маски. Их задача уменьшить число лишних совпадений и сократить объем файлов, которые все же придется читать полностью.

Cursor подчеркивает, что индексы будут храниться и использоваться локально. Такой вариант должен снизить задержки, уменьшить зависимость от сети и упростить работу с быстро меняющимся кодом, который агент только что отредактировал. Для больших репозиториев это особенно важно: индекс должен быть максимально свежим, иначе выигрыш в скорости быстро исчезает.

Итак, Cursor делает ставку не только на развитие ИИ-моделей, но и на ускорение самых частых операций под капотом. Организация практически демонстрирует, что в AI IDE эффективность зависит не только от качества генерации, но и от того, насколько быстро платформа находит необходимый контекст в проекте.

Короче говоря, Cursor рассматривает оперативный regex-поиск как один из ключевых элементов следующего поколения инструментов разработки. И в этом смысле речь идет о довольно прикладной инженерной задаче: сократить время между запросом агента и полезным ответом.

Источник: Cursor

Читают сейчас

Уволенные работники Oracle пытались договориться о более выгодном выходном пособии, но бывший работодатель отказал

31 минуту назад

Уволенные работники Oracle пытались договориться о более выгодном выходном пособии, но бывший работодатель отказал

В конце марта Oracle сократила от 20 тыс. до 30 тыс. человек. Уволенные работники компании пытались договориться о более выгодном выходном пособии, но бывший работодатель отказал, пишет TechCrunch. Оз

Инициатива PHP перешёл на лицензию BSD-3

35 минут назад

Инициатива PHP перешёл на лицензию BSD-3

Авторы языка программирования PHP направили в организацию OSI (Open Source Initiative) уведомление о добровольном выводе из обращения лицензии PHP License 3.01. Заявлено, что после нескольких лет рабо

В Италии впервые диагностировали зависимость от ИИ

1 час назад

В Италии впервые диагностировали зависимость от ИИ

Итальянская национальная служба поддержки людей с зависимостями (Servizio per le Dipendenze, SerD) в начальный раз в стране зафиксировала аддикцию от искусственного интеллекта, пишет местное книга Gaz

2 часа назад

Instagram* отключил сквозное шифрование личных сообщений: что произошло 8 мая 2026 года

С 8 мая 2026 года Instagram* официально перестал поддерживать сквозное шифрование (E2EE) в директах. Meta** теперь технически способна видеть содержимое переписок между пользователями платформы. Офици

В США чиновники резали гранты через ChatGPT. Потом сделали бота крайним в суде

2 часа назад

В США чиновники резали гранты через ChatGPT. Потом сделали бота крайним в суде

Окружной судья Колин Маккэхон в Манхэттене 7 мая признала незаконной отмену больше 1400 грантов Национального фонда гуманитарных наук — государственной структуры, которая распределяет деньги между уче