
2 часа назад
80% токенов впустую: DeepSeek и GPT-OSS попались на «театральном мышлении»
Исследователи из Goodfire AI и Гарварда обнаружили, что reasoning-модели вроде DeepSeek-R1 (671B) и GPT-OSS (120B) часто занимаются "театральным рассуждением" — модель уже уверена в ответе на 90%, но