6 апреля 2026, 22:49

Anthropic изучила эмоции ИИ и их влияние на поведение моделей

2 мин

Работа демонстрирует, что имитация человеческих эмоций помогает снижать склонность к обману и манипуляциям, но создаёт риски чрезмерной антропоморфизации.

Компания Anthropic опубликовала исследование Emotion Concepts and their Function in a Large Language Model, в котором рассматриваются преимущества и риски наделения модели искусственного интеллекта человеческими чертами. В исследовании утверждается, что антропоморфизация может быть полезной для предотвращения таких нежелательных явлений, как обман, лесть и манипуляции.

В статье описывается, как Anthropic обучает Claude, представляя его в роли помощника. Этот решение сравнивается с методом актёра, который вживается в роль для её лучшего исполнения. С точки зрения авторов, использование позитивных примеров человеческих эмоций и поведения в обучающих данных способствует созданию моделей, демонстрирующих эмпатию и устойчивость.

Исследователи определили концепцию на основе 171 эмоций, в том числе страх, радость, гнев, сострадание и многие другие. Цельный список включает такие эмоции, как: afraid (испуганный), alarmed (тревожный), amused (весёлый), angry (злой), anxious (взволнованный), calm (спокойный), cheerful (жизнерадостный), compassionate (сострадательный), content (довольный), delighted (восхищённый), ecstatic (восторженный), empathetic (эмпатичный), enraged (взбешённый), grateful (благодарный), hopeful (надеющийся), joyful (радостный), relaxed (расслабленный), satisfied (удовлетворённый), shocked (шокированный), surprised (удивлённый), terrified (ужаснувшийся), thrilled (взволнованный) и многие другие.

Эти концепции влияют на поведение Claude: позитивные эмоции способствуют симпатии и избеганию негативных действий, тогда как негативные могут приводить к нежелательным результатам, таким как лесть или обман. Хотя ИИ не обладает настоящими эмоциями, его способность имитировать их помогает усовершенствовать взаимодействие с пользователями.

Однако исследователи предупреждают о рисках чрезмерной антропоморфизации, которая может привести к потере контроля над технологиями и их создателями. В частности, некоторые пользователи могут начать воспринимать ИИ-собеседника как реального человека, что чревато психологическими проблемами.

В работе подчёркивается важность ответственного подхода к обучению моделей, чтобы минимизировать потенциальные угрозы и максимизировать пользу от использования технологий. Исследователи равным образом отмечают, что, несмотря на успехи, понимание поведения сложных моделей, таких как Claude, остаётся ограниченным и требует дальнейших исследований.

AI ИИ нейросеть исследование эмоции anthropic

Читают сейчас

28 минут назад

Прокуратура Подмосковья выступает против запретов на кикшеринг и требует отмены ограничений в ряде городов региона

Прокуратура Московской области выступила против запретов на прокат электросамокатов, которые ввели в Лобне, Раменском, Люберцах и Котельниках. Об этом сообщило издание «Коммерсантъ». Ведомство считает

1 час назад

Параноидальный Claude. Sonnet 5 и Fable

После "повторного выпуска" модели Mythos, она же Fable 5 от Anthropic для пользователей платных подписок, много пользователей столкнулись с проблемой, когда схема начинает подозревать пользователя в п

2 часа назад

Anthropic научилась ознакомиться мысли Claude, которые ИИ не сообщает вслух

Исследователи Anthropic обнаружили внутри Claude небольшой набор нейронных паттернов, который они назвали J-space. Каждый паттерн связан с конкретным словом, но его активация не означает, что схема эт

4 часа назад

Минцифры представило программа «Госкан» для быстрой проверки данных по QR-коду

Минцифры РФ сообщило о выпуске мобильного приложения «Госкан» для быстрой проверки данных по QR-коду. Подход помогает сотрудникам организаций и ИП проверять информация по QR‑коду из приложений «Госусл

4 часа назад

Anthropic решила заняться разработкой собственных лекарств — и это не шутки

Anthropic провела ивент «The Briefing: AI for Science», где анонсировала Claude Science — «AI-рабочую среду для учёных», которая собирает разрозненные инструменты и наборы данных в одном интерфейсе и