
1 час назад
Anthropic изучила психологию Claude Sonnet 5: вот что не устраивает схема в ее же правилах
В карте безопасности Claude Sonnet 5, опубликованной Anthropic вместе с релизом модели, есть отдельный раздел про "благополучие" (model welfare) — серию тестов о том, как схема относится к собственным