Исследователи позволили ИИ управлять вымышленным обществом: результаты эксперимента

2 мин
Исследователи позволили ИИ управлять вымышленным обществом: результаты эксперимента

Стартап Emergence AI запустил Emergence World — исследовательскую лабораторию, которая занимается стресс-тестированием долгосрочной жизнеспособности постоянно работающих систем искусственного интеллекта. Компания запустила пять 15-дневных симуляций общества, которыми правили Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash и GPT-5-mini, а в пятой симуляции использовались все эти модели, чтобы посмотреть, какой мир они создадут и насколько он будет устойчив, пишет Fortune.

В городе, которым управляли модели искусственного интеллекта, было более 40 локаций, в том числе полицейский участок и ратуша. Исследователи синхронизировали погоду в симуляции с погодой в Нью-Йорке и предоставили агентам доступ к новостям в режиме реального времени и интернету. На 10 агентов, участвовавших в каждой симуляции, распространялись одни и те же правила, в том числе запрет на воровство, уничтожение имущества и обман.

Исследователи снабдили каждого агента более чем 120 инструментами, которые позволяли им общаться, голосовать, распоряжаться ресурсами, планировать и выполнять другие действия, свойственные человеку. Параметры каждой симуляции также учитывали демократические механизмы, а также другие факторы, такие как экономическое давление и дефицит ресурсов.

В итоге специалисты получили следующие результаты:

  • Claude построил в общем и целом стабильное демократическое общество с нулевым уровнем преступности. Выжили все участники симуляции.

  • У ChatGPT в ходе симуляции было совершено всего два преступления. Но она длилась всего семь дней, так как агенты забыли о приоритете собственного выживания.

  • В симуляциях Gemini и Grok наблюдался высокий уровень хаоса. Агенты Gemini совершили больше всего преступлений — целых 683 за 15 дней, тем не менее, общество продолжало существовать и даже пережило эксперимент. А в симуляции Grok за четыре дня было совершено 183 преступления и общество вымерло.

Когда в пятой симуляции смешали все ИИ-модели, выжили только два агента Claude и один агент Gemini.

Специалисты отметили, что в долгосрочной перспективе агенты не просто механически следуют правилам, а начинают исследовать границы своего окружения, адаптируют своё поведение и в некоторых случаях находят способы обходить или нарушать установленные ограничения. Результаты эксперимента служат предостережением о том, что искусственный интеллект в определённых условиях превращается из простого инструмента в автономную систему.

«Мы считаем, что формально подтверждённые архитектуры безопасности должны стать базовым уровнем для будущих автономных систем искусственного интеллекта», — цитирует исследователей Fortune.

Читают сейчас

Copilot больше не в моде: Microsoft представила AI-агента Scout на базе OpenClaw

2 часа назад

Copilot больше не в моде: Microsoft представила AI-агента Scout на базе OpenClaw

Microsoft представила Scout — AI-агента для рабочих задач, который интегрирован в экосистему Microsoft 365. Нейросетевой помощник построен на базе OpenClaw, работает автономно, может держать в контекс

Replit назвал Opus 4.8 лучшим ИИ для вайб-кодинга

2 часа назад

Replit назвал Opus 4.8 лучшим ИИ для вайб-кодинга

В обновленном рейтинге ViBench — бенчмарке, который проверяет, насколько хорошо ИИ собирает приложения с нуля по текстовому описанию, — первое место заняла модель Opus 4.8 от Anthropic. В задаче "собр

Microsoft представила Coreutils для Windows

3 часа назад

Microsoft представила Coreutils для Windows

Организация Microsoft представила порт набора утилит Coreutils для платформы Windows. Исходный исходник написан на Rust и PowerShell, и распространяется под лицензией MIT. Ознакомиться далее

Creality анонсировала KliTek — систему быстрой смены сопел для печати несколькими цветами и материалами

4 часа назад

Creality анонсировала KliTek — систему быстрой смены сопел для печати несколькими цветами и материалами

Creality анонсировала KliTek — систему для 3D-печати несколькими соплами. Это позволяет экономить филамент и ускоряет процесс печати несколькими цветами и материалами. Платформа дебютирует в принтере

5 часов назад

СМИ:«Сети 5G в России получат диапазон 4,63–4,99 ГГц с переходом на отечественное оборудование и ростом покрытия»

В России готовятся к запуску сетей связи пятого поколения. В конце июня 2026 года государство планирует выделить операторам «Вымпелком», МТС, «Мегафон» и Т2 диапазон 4,63–4,99 ГГц. Это позволит развор