Anthropic добавила в Claude Code автоматическую проверку pull request

3 мин
Anthropic добавила в Claude Code автоматическую проверку pull request

Anthropic представила Code Review - новую функцию в Claude Code, которая автоматически проверяет pull request и ищет не стилистические огрехи, а потенциально опасные ошибки в логике программы. Инструмент уже доступен в формате research preview для команд с тарифами Team и Enterprise.

Зачем это понадобилось

Anthropic объясняет запуск просто: с ростом использования ИИ кода стало больше, а ручная тест стала замедлять процесс. По данным компании, за год объем кода на одного инженера внутри Anthropic вырос на 200%, и code review превратился в одно из главных узких мест.

Как работает Code Review

После открытия pull request платформа запускает некоторое количество ИИ-модулей с разными ролями:

  • одни ищут ошибки в изменениях;

  • другие перепроверяют найденные замечания;

  • третьи собирают итоговый отчет и расставляют приоритеты.

В результате в pull request появляются:

  • один совокупный комментарий с итогами проверки;

  • точечные замечания в конкретных местах кода.

Anthropic подчеркивает, что функция сосредоточена именно на логических ошибках, а не на стиле, форматировании или линтинге.

Что именно ищет система

Code Review рассчитан на поиск проблем, которые могут реально повлиять на работу продукта:

  • ошибки в логике;

  • неочевидные побочные эффекты;

  • проблемы на стыке нескольких файлов;

  • сбои в редких сценариях;

  • потенциально опасные изменения в больших правках.

Для крупных pull request проверка становится глубже, для небольших - проще. Среднее время анализа, по данным Anthropic, составляет около 20 минут.

Что показало внутреннее использование

Anthropic уже некоторое количество месяцев использует систему почти на всех внутренних pull request. Организация приводит такие цифры:

Показатель

Значение

PR с содержательными замечаниями до запуска

16%

PR с содержательными замечаниями после запуска

54%

Крупные PR, где нашли проблемы

84%

Среднее число замечаний в крупных PR

7,5

Небольшие PR, где нашли проблемы

31 процентов

Среднее число замечаний в небольших PR

0,5

Доля ложных срабатываний по оценке инженеров

менее 1%

Организация также приводит два примера:

  • модификация в одну строку могло нарушить механизм аутентификации;

  • в проекте TrueNAS система обнаружила старую ошибку с несовпадением типов данных, в связи с которой мог стираться кэш ключей шифрования.

Сколько стоит

Средняя стоимость одного ревью - от 15 до 25 долларов. Цена зависит от размера изменений, сложности кода и глубины проверки.

Для контроля расходов доступны:

  • лимиты на организацию;

  • включение только для выбранных репозиториев;

  • панель статистики по числу проверок, расходам и полезности замечаний.

Как подключить

Для включения функции администратору нужно:

  1. открыть настройки Claude Code;

  2. установить GitHub App;

  3. выбрать репозитории, где будет функционировать автоматическая проверка.

После этого ревью запускается автоматически для новых pull request.

Что меняется в ходе разработки

Главная мысль в этом запуске не в том, что ИИ «теперь и ревьюит код». Важнее другое: инструменты для разработки начинают закрывать не только этап написания кода, но и этап его проверки.

Пока такие системы не заменяют человека и не принимают подход вместо команды. Но они могут снять часть рутинной нагрузки и вовремя подсветить рискованные изменения, которые легко пропустить в потоке правок.

Для команд, где ИИ уже активно участвует в разработке, это выглядит как довольно логичное развитие процесса: сначала инструменты ускорили написание кода, теперь они начинают страховать его качество.

Читают сейчас

Представлен публике публичный инициатива Emscripten 6.0 — компилятор из C/C++ в WebAssembly

9 минут назад

Представлен публике публичный инициатива Emscripten 6.0 — компилятор из C/C++ в WebAssembly

Состоялся выпуск открытого проекта Emscripten 6.0. Это решение позволяет компилировать код на C/C++ и других языках, для которых имеются фронтенды на базе LLVM, в универсальный низкоуровневый промежут

Инженеры Дьюкского университета представили робота Argus с 20 телескопическими конечностями

4 часа назад

Инженеры Дьюкского университета представили робота Argus с 20 телескопическими конечностями

Инженеры Дьюкского университета представили Argus — робота без передней и задней частей с 20 модульными телескопическими конечностями, расходящимися от ядра в центре. робототехники утверждают, что на

В соответствии с информации, версия видеокарт NVIDIA RTX 50 SUPER cнова на верном пути

6 часов назад

В соответствии с информации, версия видеокарт NVIDIA RTX 50 SUPER cнова на верном пути

1. Потенциальное апдейт серии Nvidia Blackwell 50 до версии «Super» уже почти год обсуждается в новостях, последнее существенное упоминание об этом появилось девять месяцев назад благодаря калькулятор

Что нового в iOS 27: улучшенная Siri и работа над ошибками в Liquid Glass

6 часов назад

Что нового в iOS 27: улучшенная Siri и работа над ошибками в Liquid Glass

Apple открыла ежегодную конференцию WWDC презентацией обновлений в своих операционных системах. Ивент получилось довольно скучным, если сравнивать его с прошлыми годами. Организация сосредоточилась на

Из ИИ-агентов выходят хорошие программисты, но плохие биологи. Anthropic объясняет почему

7 часов назад

Из ИИ-агентов выходят хорошие программисты, но плохие биологи. Anthropic объясняет почему

Организация Anthropic выпустила разбор о том, почему ИИ-агенты уже стали сильными программистами, но в биологии буксуют. Ответ авторов: проблема не в уме агента, а в данных, по которым он движется. Он