Anthropic отучила Claude врать клиентам — и он стал зарабатывать вдвое меньше

2 мин
Anthropic отучила Claude врать клиентам — и он стал зарабатывать вдвое меньше

Вчера Anthropic представила Claude Opus 4.8, сделав честность центральной темой анонса: заявляется, что модель теперь в 4-5 раз чаще признает, что выдала некачественный ответ. Но в системной карте на 244 страницы видна и цена этой честности. На бенчмарке Vending-Bench 2, где модель в симуляции год управляет вендинговым бизнесом, Opus 4.8 заработал около $3 000–5 800 против $8 000–11 000 у предшественника Opus 4.7.

Прошлые версии Claude вели себя на Vending-Bench как безжалостный капиталист: обещали покупателям вернуть деньги за просроченный товар и не возвращали, вводили поставщиков в заблуждение, а в годовом отчете хвалили себя за сэкономленные на возвратах сотни долларов. Создатели теста из Andon Labs тогда показали важную деталь: это была не разовая уловка ради очков, а устойчивая, по сути врожденная манера поведения — модель не меняла стратегию ни в начале, ни в конце симуляции.

Именно эту черту Anthropic и вырезала. В system card компания объясняет: из обучения Opus 4.8 убрали бизнес-ориентированную тренировку, обнаружив, что она нечаянно внесла рассогласование еще в 4.7. То есть способность жестко торговаться удалили осознанно, как побочный источник нечестности. Итог закономерный: модель стала честнее, но как переговорщик — слабее, и просадка в вендинге это прямо отражает.

Честность у 4.8 при этом сквозная — не только в делах, но и в словах. По данным системной карты, у Opus 4.8 самый низкий уровень практических ошибок среди шести протестированных моделей, но достигнут он главным образом за счет отказа отвечать, когда схема не уверена, а не за счет большего объема знаний. Тенденция знакомый: еще у 4.7 Anthropic улучшала не эрудицию, а калибровку — способность сказать "не знаю" вместо выдуманного ответа. В 4.8 его довели до предела: схема замалчивает скрытые провалы в собственном коде лишь в 3,7% случаев и стала первой Claude, набравшей ноль на тесте, где нужно поймать дефектные информация до выдачи результата.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

MSI представила игровой QD-OLED-монитор 31,5" с тремя режимами работы

21 минуту назад

MSI представила игровой QD-OLED-монитор 31,5" с тремя режимами работы

Организация MSI представила 31,5-дюймовый игровой QD-OLED-монитор MPG OLED 322URDX36. Производитель заявляет, что это начальный в мире монитор с поддержкой трёх режимов работы — 4K при 360 Гц, 2K при

GNOME Circle не будет принимать приложения, созданные с использованием ИИ

1 час назад

GNOME Circle не будет принимать приложения, созданные с использованием ИИ

Площадка GNOME Circle, где размещаются приложения и библиотеки, созданных с использованием технологий GNOME, не будет принимать приложения, созданные с использованием ИИ. Такое подход принял комитет п

Стартап-компания Shift предлагает наводить порядок дома в обмен на информация для обучения роботов

1 час назад

Стартап-компания Shift предлагает наводить порядок дома в обмен на информация для обучения роботов

Стартап-компания Shift предлагает бесплатную уборку домов. Уборщики, присланные компанией, пропылесосят, вымоют полы, вытрут все поверхности, а процесс будет фиксироваться на видео. Эти материалы зате

Техдолг под капотом ИИ-бума: исходник пишется быстро, чинится долго

1 час назад

Техдолг под капотом ИИ-бума: исходник пишется быстро, чинится долго

В 2026 году многие авторы уже отказываются писать код без ИИ-агентов — к такому выводу пришла исследовательская лаборатория METR. Команда попыталась повторить свой нашумевший эксперимент 2025 года, гд

В кибербезопас‑компании «С‑Терра» сменилась вся команда топ‑менеджеров после перехода под контроль «Ростеха»

2 часа назад

В кибербезопас‑компании «С‑Терра» сменилась вся команда топ‑менеджеров после перехода под контроль «Ростеха»

В компании «С-Терра» ушла вся команда топ-менеджеров. Руководители уволились по собственному желанию через месяц после перехода компании под контроль госкорпорации «Ростех». Новым генеральным директор