Anthropic выпустила средство для проверки ИИ-кода

4 мин
Anthropic выпустила средство для проверки ИИ-кода

Anthropic представила инструмент проверки кода на основе ИИ, предназначенный для выявления ошибок до того, как они попадут в кодовую базу программного обеспечения. Новый продукт под названием Code Review уже запустили в Claude Code.

В программировании обратная связь имеет решающее значение для раннего выявления ошибок, поддержания согласованности кодовой базы и повышения общего качества программного обеспечения. Распространение вайб-кодинга изменило решение разработчиков, а равным образом привело к появлению новых ошибок, повысило риски безопасности и объём непонятного кода, отмечают в компании.

«Мы наблюдаем значительный увеличение популярности Claude Code, особенно в корпоративном секторе, и один из вопросов, который нам постоянно задают руководители предприятий: теперь, когда Claude Code создает много запросов на слияние (pull requests), как мне убедиться, что они эффективно проверяются?» — отметила руководитель отдела продуктов Anthropic Кэт Ву.

Авторы используют pull requests для отправки изменений кода на проверку перед тем, как они попадут в программное обеспечение. Ву сказала, что Claude Code значительно расширил объём выпускаемого кода, а это привело к увеличению количества проверок PR, и это создавало узкое место в процессе выпуска кода.

Code Review сначала будет доступен для клиентов Claude for Teams и Claude for Enterprise в контексте предварительной исследовательской версии. «Этот продукт ориентирован прежде всего на крупных корпоративных пользователей, таких как Uber, Salesforce, Accenture, которые уже используют Claude Code и теперь хотят получить помощь в обработке огромного количества запросов на слияние (pull requests), которые он генерирует», — сказала Ву.

Она добавила, что руководители разработчиков могут активировать проверку кода по умолчанию для каждого инженера в команде. После включения она интегрируется с GitHub и автоматически анализирует запросы на слияние, оставляя комментарии непосредственно в коде, объясняя потенциальные проблемы и предлагая решения.

По словам Ву, основное внимание уделяется исправлению логических ошибок, а не стилистических.

«Это действительно важно, потому что многие разработчики уже сталкивались с автоматизированной обратной связью от ИИ, и их раздражает, когда она не сразу применима на практике. Мы решили сосредоточиться исключительно на логических ошибках. Таким образом, мы выявляем наиболее приоритетные проблемы, которые необходимо исправить», — пояснила менеджер.

ИИ пошагово объясняет свои рассуждения, описывая, в чём, по его мнению, заключается задача, почему она может вызвать ошибки и как её можно исправить. Система будет помечать проблемы с помощью цветовых индикаторов: красный — наиболее серьёзные, жёлтый — потенциальные проблемы, требующие проверки, и фиолетовый — проблемы, связанные с уже существующим кодом или более ранними ошибками.

Ву сказала, что в процессе несколько агентов работают параллельно, причём каждый изучает кодовую базу с разных точек зрения или в разных аспектах. Финальный агент агрегирует и ранжирует результаты, удаляя дубликаты и определяя приоритетность наиболее важных проблем.

Инструмент обеспечивает поверхностный анализ безопасности, а руководители инженерных групп могут настраивать дополнительные проверки на основе внутренних передовых методов. Ву сказала, что недавно запущенный компанией Anthropic инструмент Claude Code Security обеспечивает более глубокий аналитика безопасности.

Многоагентная архитектура означает, что это может быть ресурсоемкий продукт, сказала Ву. Как и в других сервисах ИИ, ценообразование основано на токенах, и стоимость варьируется в зависимости от сложности кода — хотя менеджер оценила стоимость каждой проверки в среднем в $15–25. Она добавила, что это премиальный и необходимый служба, поскольку инструменты ИИ генерируют всё больше и больше кода.

«Проверка кода — это то, что пользуется невероятным спросом на рынке. По мере того, как инженеры разрабатывают приложения с помощью Claude Code, они видят, как снижается сложность создания новых функций, и как значительно возрастает спрос на проверку кода. Поэтому мы надеемся, что благодаря этому мы позволим предприятиям создавать приложения быстрее, чем когда-либо прежде, и с гораздо меньшим количеством ошибок, чем когда-либо прежде», — заключила Ву. 

Между тем OpenAI объявила о запуске Codex Security — нового ИИ-агента для анализа безопасности программного кода. Он способен находить уязвимости в проектах, проверять их и предлагать исправления. Codex Security анализирует репозитории и формирует контекстную схема угроз для конкретного проекта. Затем платформа ищет потенциальные уязвимости, оценивает их реальное влияние на систему и, при необходимости, проверяет найденные проблемы в изолированной среде. Сейчас продукт доступен в исследовательском режиме для пользователей ChatGPT Enterprise, Business и Edu.

Читают сейчас

1 час назад

Минцифры, РКН и Roblox согласовали меры по защите детей и снятию ограничений на работу платформы в России

Минцифры России получило от компании Roblox гарантии соблюдения российского законодательства. Согласно заявлению ведомства, Министерство наряду с Роскомнадзором ведёт прямой диалог с операторами заруб

1 час назад

Data Insight опубликовало рейтинг топ-100 интернет-магазинов России за 2025 год

Аналитическое агентство Data Insight опубликовало ежегодный рейтинг ста крупнейших интернет-магазинов России по итогам 2025 года. Ознакомиться далее

Signal назвал требование Великобритании сканировать устройства «антиутопией» и угрозой для всех пользователей

1 час назад

Signal назвал требование Великобритании сканировать устройства «антиутопией» и угрозой для всех пользователей

Signal опубликовал официальное заявление в связи с требование правительства Великобритании обязать технологические компании сканировать весь контент на всех устройствах, используемых в стране. Ознаком

Meta* удалила систему распознавания лиц из своего приложения для умных очков

1 час назад

Meta* удалила систему распознавания лиц из своего приложения для умных очков

Meta* удалила из приложения Meta* AI код системы распознавания лиц NameTag — после того как книга Wired сообщило о её существовании. Компания при этом заявила, что «окончательного решения» о запуске ф

1 час назад

Xiaomi разогнали 1T-модель до 1200 tok/s на стандартных GPU

Китайские команды MiMo и TileRT опубликовали режим UltraSpeed для модели MiMo V2.5 Pro (1,02T параметров). На одном 8-карточном сервере со стандартными GPU, до ~1200 токенов в секунду. Cerebras выдаёт