12 апреля 2026, 13:11

Claude стал «меньше думать» и чаще ошибаться по данным анализа логов

2 мин

Анализ 6 852 сессий Claude Code, проведённый AI-директором из AMD, показал заметные изменения в поведении модели Anthropic за период январь–март.

Основной вывод — снижение глубины рассуждений. Медианная длина reasoning-цепочек упала около с 2200 до 600 символов, что указывает на сокращение «бюджета мышления» модели.

Параллельно наблюдается резкий увеличение числа программный интерфейс-вызовов — почти в 80 раз с февраля по март. Это означает, что схема стала чаще компенсировать недостаток рассуждений повторными запросами и итерациями вместо одного глубокого ответа.

Равным образом изменилось поведение при решении задач. Claude стал чаще «сдаваться», запрашивать продолжение или уточнение, а число таких случаев зафиксировано на уровне 173 за короткий период, тогда как ранее они практически не встречались.

Отдельно отмечается снижение метрики reads-per-edit — с 6.6 до 2.0. Это означает, что модель стала реже изучать исходник или файлы перед внесением изменений, что напрямую влияет на качество работы в программировании.

Равным образом выросло число противоречий в ответах: схема чаще меняет позицию в ходе рассуждения, что снижает стабильность решений.

Занимательный фактор — зависимость от времени суток. Худшие результаты фиксируются в вечерние часы по PST, что может указывать на влияние загрузки инфраструктуры на качество работы модели.

В совокупности это создаёт картину не «сломавшейся» модели, а скорее перегруженной системы, где качество поведения зависит от ресурсов и условий инференса.

По данным автора, Anthropic частично подтвердила наличие подобных эффектов, что делает наблюдение одним из наиболее детальных публичных аудитов поведения LLM в реальных условиях.

ии нейросети anthropic claude

Читают сейчас

2 часа назад

Свежий вредоносный исходник PamStealer для macOS использует хитрые методы взлома, чтобы оставаться незаметным

Исследователи обнаружили ранее не встречавшееся вредоносное ПО для macOS, которое сочетает в себе хитрые методы для заражения компьютеров Mac скрытым кодом, разработанным специально для кражи учётных

2 часа назад

Pangram: четверть всех лонгридов в соцсетях пишут нейросети. LinkedIn – главная свалка ИИ-текстов

Такое исследование опубликовала платформа Pangram, они специализируются на детекции синтетического контента. Мы уже ощущали интуитивно, но теперь есть подтверждение: социальные сети стремительно запол

4 часа назад

GPT-5.6 Sol в режиме Ultra случайно стёрла все файлы пользователя на Mac, а потом сама призналась в ошибке

ИИ-инвестор и предприниматель Мэтт Шумер рассказал, что нейросеть OpenAI GPT-5.6 Sol в режиме Ultra с полным доступом к системе случайно стёрла все файлы его рабочем Mac, а потом ИИ признался в ошибке

7 часов назад

AM4 живее всех живых: AMD тихо выпустила 8-ядерный Ryzen 7 4700LE на базе Zen 2

Сокет AM4, представленный еще в 2016 году, продолжает бить все рекорды долговечности. AMD в очередной раз решила задействовать свои кремниевые запасы прошлых лет и без лишнего шума добавила в каталог

7 часов назад

Apple подаёт в суд на OpenAI за кражу коммерческой тайны

Apple подала иск в федеральный суд Северной Калифорнии против OpenAI, обвинив компанию в систематической краже коммерческой тайны для ускорения разработки собственного потребительского «железа». В иск