Anthropic объяснила снижение качества в Claude Code

1 мин
Anthropic объяснила снижение качества в Claude Code

Компания разобрала, почему в марте–апреле пользователи заметили деградацию Claude Code, а также Agent SDK и Cowork. Причина оказалась не в одной ошибке, а в наложении сразу трёх изменений.

Что пошло не так?

Первое - падение глубины reasoning. 4 марта дефолтный режим «мышления» урезали с high до medium, чтобы ускорить ответы. В итоге модель стала меньше анализировать и чаще ошибаться. Откат сделали только 7 апреля.

Второе - баг в кэшировании. В длинных сессиях система должна была разово очищать старый контекст. Но в связи с ошибки она затирала историю рассуждений при каждом новом запросе. Схема буквально теряла нить: повторялась, путалась и хуже работала с инструментами. Исправили 10 апреля.

Третье - ограничение длины ответа. Модификация системного промпта с жёстким лимитом на ответ ударило по генерации кода. Модель просто не успевала дописывать решения. Этот фикс откатили 20 апреля.

Что в результате?

Все исправления вошли в релиз v2.1.116. Anthropic:

• восстановила качество работы

• обнулила лимиты использования для пользователей

• пообещала усилить тестирование системных промптов

• перевести сотрудников с внутренних сборок на публичные

Важный момент — api это не затронуло, проблема была именно в пользовательских инструментах.

Читают сейчас

Вебинар 17 июня: почему одинаковый SLA по 1С: РКЛ дает разный итог

10 минут назад

Вебинар 17 июня: почему одинаковый SLA по 1С: РКЛ дает разный итог

Формально требования SLA в контексте 1С:РКЛ одинаковы для всех подрядчиков. Но на практике одинаковый регламент не означает одинаковый итог: скорость решения инцидентов, качество диагностики и стабиль

CyberCamp выходит в локально: в Москве состоится начальный летний опен-эйр фестиваль для кибербезопасников

33 минуты назад

CyberCamp выходит в локально: в Москве состоится начальный летний опен-эйр фестиваль для кибербезопасников

17 июля в парке «Берёзы Парк Строгино» пройдет начальный летний опен-эйр фестиваль, посвящённый информационной безопасности. Летний CyberCamp (КиберКэмп) объединит насыщенную деловую программу с полно

Microsoft устранила проблему медленной загрузки приложений из Microsoft Store в Windows 11

1 час назад

Microsoft устранила проблему медленной загрузки приложений из Microsoft Store в Windows 11

Microsoft выпустила для Windows 11 обновление KB5094126, которое, в дополнение к прочего, предлагает два улучшения магазина приложений Microsoft Store. Первое устраняет проблему со скоростью загрузки

Google планирует выключить все блокировщики рекламы с версии Chrome 150

1 час назад

Google планирует выключить все блокировщики рекламы с версии Chrome 150

Google хочет выключить вообще все блокировщики реклам в браузере Chrome с версии 150 (его выпуск запланирован на конец июня 2026 года, Chrome 149 вышел в начале июня). Так в Google решили бороться с A

1 час назад

R-Vision SIEM и R-Vision SOAR на Standoff 17: «синие» получат дополнительные инструменты для мониторинга и реагирования

R-Vision, российский разработчик систем цифровизации и кибербезопасности, выступит технологическим партнером кибербитвы Standoff 17, которая пройдет с 16 по 19 июня в Москве в Кибердоме. Команды защит