Claude стал «меньше думать» и чаще ошибаться по данным анализа логов

2 мин
Claude стал «меньше думать» и чаще ошибаться по данным анализа логов

Анализ 6 852 сессий Claude Code, проведённый AI-директором из AMD, показал заметные изменения в поведении модели Anthropic за период январь–март.

Основной вывод — снижение глубины рассуждений. Медианная длина reasoning-цепочек упала около с 2200 до 600 символов, что указывает на сокращение «бюджета мышления» модели.

Параллельно наблюдается резкий увеличение числа программный интерфейс-вызовов — почти в 80 раз с февраля по март. Это означает, что схема стала чаще компенсировать недостаток рассуждений повторными запросами и итерациями вместо одного глубокого ответа.

Равным образом изменилось поведение при решении задач. Claude стал чаще «сдаваться», запрашивать продолжение или уточнение, а число таких случаев зафиксировано на уровне 173 за короткий период, тогда как ранее они практически не встречались.

Отдельно отмечается снижение метрики reads-per-edit — с 6.6 до 2.0. Это означает, что модель стала реже изучать исходник или файлы перед внесением изменений, что напрямую влияет на качество работы в программировании.

Равным образом выросло число противоречий в ответах: схема чаще меняет позицию в ходе рассуждения, что снижает стабильность решений.

Занимательный фактор — зависимость от времени суток. Худшие результаты фиксируются в вечерние часы по PST, что может указывать на влияние загрузки инфраструктуры на качество работы модели.

В совокупности это создаёт картину не «сломавшейся» модели, а скорее перегруженной системы, где качество поведения зависит от ресурсов и условий инференса.

По данным автора, Anthropic частично подтвердила наличие подобных эффектов, что делает наблюдение одним из наиболее детальных публичных аудитов поведения LLM в реальных условиях.

Читают сейчас

Artemis II завершила 10-дневный полёт и успешно вернулась на Землю

38 минут назад

Artemis II завершила 10-дневный полёт и успешно вернулась на Землю

Миссия Artemis II завершилась полной посадкой экипажа после 10-дневного полёта вокруг Луны и обратно. По данным NASA, корабль Orion вошёл в атмосферу Земли на скорости около 24–25 тысяч миль в час и у

Почему Claude Code «отупел» после февраля? Доклад на 6852 сессиях

54 минуты назад

Почему Claude Code «отупел» после февраля? Доклад на 6852 сессиях

Директор группы AI в AMD Стелла Лауренцо опубликовала на GitHub разбор работы Claude Code за три месяца — с января по март 2026 года. В основе — 6852 сессии, 234 760 вызовов инструментов и почти 18 ты

На Госуслугах открылся набор в космонавты — подать свою заявку можно до 30 июня 2026 года

57 минут назад

На Госуслугах открылся набор в космонавты — подать свою заявку можно до 30 июня 2026 года

На портале Госуслуги открылся набор в космонавты — подать свою заявку можно до 30 июня 2026 года. Требования к участию строгие, но реалистичные: заявителю должно быть меньше 35 лет, увеличение от 150

YouTube повысил цены на подписки YouTube Premium и YouTube Music Premium в США

1 час назад

YouTube повысил цены на подписки YouTube Premium и YouTube Music Premium в США

Видеохостинг YouTube подтвердил подорожание подписок YouTube Premium и YouTube Music Premium для пользователей в США. Ознакомиться далее

Anthropic перенесла планирование Claude Code в облачный сервис

1 час назад

Anthropic перенесла планирование Claude Code в облачный сервис

Организация Anthropic добавила в Claude Code новую команду /ultraplan, которая выносит этап планирования задач из локального CLI в облачную среду Claude Code на вебе. Читать далее