Anthropic открыли доступ к Code Review: команда агентов на каждый PR

2 мин
Anthropic открыли доступ к Code Review: команда агентов на каждый PR

Anthropic запустили ревью кода через агентов — и это уже работает на их собственных PR.

Когда разработчик открывает pull request, Code Review автоматически запускает команду агентов. Они параллельно ищут баги, потом фильтруют ложные срабатывания и ранжируют проблемы по серьёзности. На выходе — один общий комментарий к PR и отдельные инлайн-замечания по конкретным местам. Время обработки в среднем приблизительно 20 минут.

Внутри Anthropic до внедрения системы содержательные комментарии получали 16% PR. После — 54%. На больших PR (от 1000 строк) находки появляются в 84% случаев, в среднем 7,5 проблем на ревью. Меньше 1% замечаний авторы помечают как ошибочные.

Один из реальных кейсов: однострочное изменение в продакшн-сервисе выглядело рутинно, но Code Review пометил его как критическое. Изменение сломало бы аутентификацию сервиса — и это поймали до мёржа. Другой случай — у клиента в open-source проекте TrueNAS агенты нашли баг в соседнем коде, который PR даже не трогал: type mismatch тихо сбрасывал кеш ключей шифрования при каждой синхронизации.

Стоит это дороже, чем существующий GitHub Action от Anthropic (он по-прежнему бесплатный и open source). Средняя цена ревью — $15–25, масштабируется с размером PR.

Опция доступна в research preview для Team и Enterprise планов.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Читают сейчас

HPE прогнозирует выручку выше ожиданий на фоне роста спроса на AI-серверы

1 час назад

HPE прогнозирует выручку выше ожиданий на фоне роста спроса на AI-серверы

Организация Hewlett Packard Enterprise (HPE) заявила, что ожидает выручку во втором квартале выше прогнозов аналитиков благодаря растущему спросу на серверы для искусственного интеллекта, оснащённые ч

«Не верьте нам»: топ-исследователь OpenAI объявил, что судьбу ИИ нельзя решать за закрытыми дверями

2 часа назад

«Не верьте нам»: топ-исследователь OpenAI объявил, что судьбу ИИ нельзя решать за закрытыми дверями

Ноам Браун — исследователь OpenAI, создатель рассуждающих моделей o1 и o3, а до этого покерных ИИ Libratus и Pluribus — опубликовал эссе, в котором заявил: ни AI-компании, ни спецслужбы не должны реша

Новые чипы AMD Ryzen AI P100 работают при −40°C

3 часа назад

Новые чипы AMD Ryzen AI P100 работают при −40°C

AMD официально расширила семейство Ryzen AI Embedded P100, выпустив процессоры, которые дают фору по количеству ядер многим ноутбукам и настольным системам. Вслед за скромными 4- и 6-ядерными собратья

Агентная IDE от JetBrains стала доступна в public preview

3 часа назад

Агентная IDE от JetBrains стала доступна в public preview

JetBrains выпустили Air — отдельную среду для работы с агентами, которую они сами позиционируют как "существующую параллельно с обычной IDE, а не внутри неё". Air поддерживает Codex, Claude Agent, Gem

Учёные запустили компьютерную эмуляцию мозга плодовой мушки

4 часа назад

Учёные запустили компьютерную эмуляцию мозга плодовой мушки

Компания Eon Systems опубликовала видео, которое называет первой в мире демонстрацией работы полной эмуляции мозга, управляющей телом в симуляции. Ещё в 2024 году учёные опубликовали в журнале Nature