1 час назад
Исследователи позволили ИИ управлять вымышленным обществом: результаты эксперимента

Стартап Emergence AI запустил Emergence World — исследовательскую лабораторию, которая занимается стресс-тестированием долгосрочной жизнеспособности постоянно работающих систем искусственного интеллекта. Компания запустила пять 15-дневных симуляций общества, которыми правили Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash и GPT-5-mini, а в пятой симуляции использовались все эти модели, чтобы посмотреть, какой мир они создадут и насколько он будет устойчив, пишет Fortune.
В городе, которым управляли модели искусственного интеллекта, было более 40 локаций, в том числе полицейский участок и ратуша. Исследователи синхронизировали погоду в симуляции с погодой в Нью-Йорке и предоставили агентам доступ к новостям в режиме реального времени и интернету. На 10 агентов, участвовавших в каждой симуляции, распространялись одни и те же правила, в том числе запрет на воровство, уничтожение имущества и обман.
Исследователи снабдили каждого агента более чем 120 инструментами, которые позволяли им общаться, голосовать, распоряжаться ресурсами, планировать и выполнять другие действия, свойственные человеку. Параметры каждой симуляции также учитывали демократические механизмы, а также другие факторы, такие как экономическое давление и дефицит ресурсов.
В итоге специалисты получили следующие результаты:
Claude построил в общем и целом стабильное демократическое общество с нулевым уровнем преступности. Выжили все участники симуляции.
У ChatGPT в ходе симуляции было совершено всего два преступления. Но она длилась всего семь дней, так как агенты забыли о приоритете собственного выживания.
В симуляциях Gemini и Grok наблюдался высокий уровень хаоса. Агенты Gemini совершили больше всего преступлений — целых 683 за 15 дней, тем не менее, общество продолжало существовать и даже пережило эксперимент. А в симуляции Grok за четыре дня было совершено 183 преступления и общество вымерло.
Когда в пятой симуляции смешали все ИИ-модели, выжили только два агента Claude и один агент Gemini.
Специалисты отметили, что в долгосрочной перспективе агенты не просто механически следуют правилам, а начинают исследовать границы своего окружения, адаптируют своё поведение и в некоторых случаях находят способы обходить или нарушать установленные ограничения. Результаты эксперимента служат предостережением о том, что искусственный интеллект в определённых условиях превращается из простого инструмента в автономную систему.
«Мы считаем, что формально подтверждённые архитектуры безопасности должны стать базовым уровнем для будущих автономных систем искусственного интеллекта», — цитирует исследователей Fortune.
Читают сейчас

2 часа назад
Copilot больше не в моде: Microsoft представила AI-агента Scout на базе OpenClaw
Microsoft представила Scout — AI-агента для рабочих задач, который интегрирован в экосистему Microsoft 365. Нейросетевой помощник построен на базе OpenClaw, работает автономно, может держать в контекс

2 часа назад
Replit назвал Opus 4.8 лучшим ИИ для вайб-кодинга
В обновленном рейтинге ViBench — бенчмарке, который проверяет, насколько хорошо ИИ собирает приложения с нуля по текстовому описанию, — первое место заняла модель Opus 4.8 от Anthropic. В задаче "собр

3 часа назад
Microsoft представила Coreutils для Windows
Организация Microsoft представила порт набора утилит Coreutils для платформы Windows. Исходный исходник написан на Rust и PowerShell, и распространяется под лицензией MIT. Ознакомиться далее

4 часа назад
Creality анонсировала KliTek — систему быстрой смены сопел для печати несколькими цветами и материалами
Creality анонсировала KliTek — систему для 3D-печати несколькими соплами. Это позволяет экономить филамент и ускоряет процесс печати несколькими цветами и материалами. Платформа дебютирует в принтере
5 часов назад
СМИ:«Сети 5G в России получат диапазон 4,63–4,99 ГГц с переходом на отечественное оборудование и ростом покрытия»
В России готовятся к запуску сетей связи пятого поколения. В конце июня 2026 года государство планирует выделить операторам «Вымпелком», МТС, «Мегафон» и Т2 диапазон 4,63–4,99 ГГц. Это позволит развор