6 апреля 2026, 22:49
Anthropic изучила эмоции ИИ и их влияние на поведение моделей

Работа демонстрирует, что имитация человеческих эмоций помогает снижать склонность к обману и манипуляциям, но создаёт риски чрезмерной антропоморфизации.
Компания Anthropic опубликовала исследование Emotion Concepts and their Function in a Large Language Model, в котором рассматриваются преимущества и риски наделения модели искусственного интеллекта человеческими чертами. В исследовании утверждается, что антропоморфизация может быть полезной для предотвращения таких нежелательных явлений, как обман, лесть и манипуляции.
В статье описывается, как Anthropic обучает Claude, представляя его в роли помощника. Этот решение сравнивается с методом актёра, который вживается в роль для её лучшего исполнения. С точки зрения авторов, использование позитивных примеров человеческих эмоций и поведения в обучающих данных способствует созданию моделей, демонстрирующих эмпатию и устойчивость.
Исследователи определили концепцию на основе 171 эмоций, в том числе страх, радость, гнев, сострадание и многие другие. Цельный список включает такие эмоции, как: afraid (испуганный), alarmed (тревожный), amused (весёлый), angry (злой), anxious (взволнованный), calm (спокойный), cheerful (жизнерадостный), compassionate (сострадательный), content (довольный), delighted (восхищённый), ecstatic (восторженный), empathetic (эмпатичный), enraged (взбешённый), grateful (благодарный), hopeful (надеющийся), joyful (радостный), relaxed (расслабленный), satisfied (удовлетворённый), shocked (шокированный), surprised (удивлённый), terrified (ужаснувшийся), thrilled (взволнованный) и многие другие.
Эти концепции влияют на поведение Claude: позитивные эмоции способствуют симпатии и избеганию негативных действий, тогда как негативные могут приводить к нежелательным результатам, таким как лесть или обман. Хотя ИИ не обладает настоящими эмоциями, его способность имитировать их помогает усовершенствовать взаимодействие с пользователями.
Однако исследователи предупреждают о рисках чрезмерной антропоморфизации, которая может привести к потере контроля над технологиями и их создателями. В частности, некоторые пользователи могут начать воспринимать ИИ-собеседника как реального человека, что чревато психологическими проблемами.
В работе подчёркивается важность ответственного подхода к обучению моделей, чтобы минимизировать потенциальные угрозы и максимизировать пользу от использования технологий. Исследователи равным образом отмечают, что, несмотря на успехи, понимание поведения сложных моделей, таких как Claude, остаётся ограниченным и требует дальнейших исследований.
Читают сейчас
54 минуты назад
Учёные предложили добывать «белый» водород
Водород бывает разных цветов — точнее, так его обозначают экологи и промышленники, имея в виду разные способы получения. «Коричневый» водород зарабатывают при сжигании угля, «серый» — из метана. Более

1 час назад
Perplexity выложила в open-source Bumblebee: read-only сканер ИИ-окружений для защиты от supply-chain атак
Perplexity AI открыла исходный код Bumblebee - статического сканера для защиты локальных машин от атак на цепочки поставок (supply-chain). Утилита написана на Go и проверяет конфигурации агентов, расш

1 час назад
LLMStart.ru запускает продвинутую программу Deep Agents для разработки сложных ИИ-систем
28 мая стартует онлайн-курс Deep Agents от LLMStart.ru, направленный на проектирование сложных ИИ-систем и подход архитектурных проблем RAG при работе с неструктурированными данными. В контексте курса

3 часа назад
Как AI меняет процессы разработки: закрытая сессия red_mad_robot
28 мая наша команда проведёт закрытую офлайн-встречу, посвящённую изменениям в инженерных процессах и разработке с AI. На встрече обсудим переход от локального использования AI к более системной работ
3 часа назад
Мы запустили Маркуса — виртуальный помощник команды маркетинга и коммуникаций
Маркус — это мультиагентная ИИ-система, помогающая СМО и его команде со всеми ключевыми функциями современного маркетинга: от аналитики и исследований рынка до генерации идей, создания коммуникационны