2 часа назад
Anthropic назвала причины «отупения» Claude Code

Anthropic объяснила, почему части пользователей Claude Code в последние недели казалось, что инструмент стал хуже писать и править код. В инженерном разборе компания пишет, что дело было не в самой модели, а в продуктовой обвязке вокруг нее: настройке глубины рассуждения (reasoning effort), работе с контекстом и системной инструкции. По версии Anthropic, изменения затронули Claude Code, Claude Agent SDK и Claude Cowork, но не программный оболочку и не инфраструктуру инференса.
4 марта Anthropic переключила настройку рассуждения по умолчанию в Claude Code с high на medium, чтобы снизить задержки, расход токенов и число ситуаций, когда казалось, что интерфейс завис. Вскоре пользователи стартовали жаловаться, что Claude Code стал менее сообразительным. 7 апреля компания откатила подход: теперь Opus 4.7 по умолчанию работает на xhigh, а остальные модели — на high.
Вторая причина связана с очисткой старых блоков "мышления" после простоя сессии больше часа. Anthropic хотела убирать лишние рассуждения один раз, чтобы снижать задержку и расход токенов при возвращении к работе. Но из-за бага очистка запускалась снова на каждом следующем шаге. В результате Claude мог терять понимание того, почему раньше выбрал те или иные правки и вызовы инструментов: он забывал контекст, повторялся и хуже выбирал следующие действия.
Третья причина — инструкция отвечать короче. Anthropic пыталась уменьшить многословие Claude Code и добавила правило: между вызовами инструментов писать не длиннее 25 слов, а финальный ответ держать в пределах 100 слов, если проблема не требует большего. Вместе с другими изменениями промпта это ударило по качеству работы с кодом: на одной из расширенных внутренних проверок организация увидела снижение на 3 процентов для Opus 4.6 и Opus 4.7. Инструкцию откатили 20 апреля; все три проблемы, по версии Anthropic, закрыты к версии v2.1.116.
Этот случай хорошо демонстрирует хрупкость агентных ИИ-инструментов. Для пользователя все выглядит просто: "Claude стал хуже". Но на практике качество такого продукта зависит не только от весов модели, а от множества внешних решений — уровня рассуждения, кеша, управления контекстом, системных инструкций и интерфейсных компромиссов. Даже сильная модель в такой обвязке может начать вести себя как сломанный инструмент.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас
2 часа назад
Анонс лекции по MBSE
Как управлять ИТ-продуктом, когда хаос становится нормой? 27 апреля в 16:00 вместе с экспертом по системной инженерии Антоном Королевым узнаем, как управлять жизненным циклом продукта в условиях посто

5 часов назад
В НАСА обнаружили земной грибок, который может «заразить» Марс
Исследователи выявили вид, способный выживать в условиях радиации, экстремальной жары и в (пока что) имитированной марсианской почве, что ставит под угрозу протоколы, призванные сохранить «незапятнанн

5 часов назад
Bambu Lab угрожает судом разработчику, который вернул в форк Orca Slicer отправку заданий на принтеры компании
Разработчик Павел Ярчак (Paweł Jarczak) опубликовал форк Orca Slicer, в который вернул функция отправлять задания для печати на принтеры Bamu Lab. Из-за это компания потребовала удалить проект, заявил

5 часов назад
ИИ-трек Дурова успели защитить до того, как его стартовали применять другие для монетизации
Кто-то защитил авторским правом ИИ-трек Дурова про цифровую свободу до того, как его начали применять другие для монетизации. Один из блогеров вставил песню в своё видео, но после этого сразу прислали

6 часов назад
От самописных скриптов к промышленной платформе: автоматизация международного хостинга на базе VMmanager и BILLmanager
VPS.one — международный хостинг-провайдер, специализирующийся на виртуальных серверах (VPS) на базе KVM с SSD-накопителями и полным root-доступом. Организация работает с клиентами по всему миру, фокус