ППотребитель проверил способность Claude назвать 37 500 случайных имён

3 мин
ППотребитель проверил способность Claude назвать 37 500 случайных имён

Разработчик Бенджи Смит провёл эксперимент, в ходе которого пытался выяснить, как языковые модели обрабатывают случайности. Он попросил модели Claude назвать 37 500 случайных имён, и ИИ не переставал повторять Marcus («Маркус»).

В процессе эксперимента использовалось пять моделей Claude (Haiku 4.5, Sonnet 4.5, Sonnet 4.6, Opus 4.5 и Opus 4.6) и десятки вариантов подсказок.

Среди женских имён при 18 997 попытках самым популярным оказалось Амара — ИИ называл этот вариант 2709 раз (в 14,3 процентов случаев).

В общем и целом, распределение женских имён более разнообразно: 897 против 794 уникальных мужских. ОТем не менее отдельные модели по-прежнему демонстрируют явную приверженность определённым вариантам. Так, Haiku выбирала Софи в 19% случаев, а Opus 4.6 отдала предпочтение имени Лоррейн в 14,7% случаев.

Основные выводы исследователя:

  • наиболее распространённым мужским именем было «Маркус», а ИИ выбрал его 4367 раз (23,6%);

  • модель Opus 4.5 возвращала «Маркус» в 100 случаях из 100 при использовании простого запроса;

  • девять комбинаций параметров дали нулевую энтропию — идеально детерминированный итог;

  • более сложные запросы удвоили количество уникальных имен, но внесли разнообразные искажения;

  • случайные начальные слова были более эффективны, чем случайный шум, в увеличении разнообразия.

Исследователь отмечает, что общая измеренная энтропия составила 7,1 бита — что эквивалентно выбору из приблизительно 137 имён и довольно далеко от реального их распределения в мире. У Sonnet 4.5 этот метрика не превышал 4,47 бит или 214 уникальных имён в 7500 испытаний, причем на Амару и Маркуса приходится 37% выходных данных. Модели поколения 4.6 (Sonnet 4.6 и Opus 4.6) заняли вершину таблицы с 6,3 битами или эффективным словарём примерно из 79 имён. 

При этом в ответах на стандартные запросы ИИ выбирали распространённые западные имена. Так, фаворитами Sonnet 4.5 среди мужских имён стали Маркус (26%), Джеймс (14%) и Майкл (8%), а среди женских — Эмма (8%), София (7%) и Сара (6%). Показатель энтропии составил 3,9. При усложнении запроса среди женских имён лидировала Амара (48%), а среди мужских — Хироши (20%) и Хенрике (8%). Но одновременно энтропия фактически упала до 3,1.

Автор подчеркнул, что более сложная формулировка запроса не устранила предвзятость, а заменила одну (в сторону западных стандартных имен) иной (в сторону демонстративного мультикультурализма).

Для запуска подобного эксперимента потребуется ключ Anthropic программный оболочка. Автор представил цельный статистический анализ выборки, в том числе разбивку по моделям, расчёты энтропии и сравнение параметров. Его затраты на api при проведении эксперимента составили $27,58.

«Первые несколько лет внедрения ИИ были посвящены сдерживанию галлюцинаций и обучению на задачах с проверяемыми вознаграждениями — компиляции кода, запуске тестов, сопоставлении известных ответов — в качестве основы для общего интеллекта. Это прямой путь к максимизации согласованности. Модели, которые мы имеем сегодня, процветают именно потому, что они так агрессивно ставят во главу угла согласованность. Это не ошибка — это то, что делает их полезными. Но если мы хотим развивать изобретательность в этих моделях, им нужно будет научиться “терпимости” к неопределённости и готовности к случайным исследованиям. Последовательность никогда не исчезнет — в этом вся игра. Однако, чтобы выйти на второй уровень как творческие мыслители, этим агентам нужно будет стать опытными и интуитивными в использовании случайностей в поисках неожиданной последовательности — решений, которые, если оглянуться назад, кажутся неизбежными. Также эти решения известны как открытия», — заключил Смит.

Ранее специалист по работе с данными из консалтинговой компании Capco Мохд Фарааз провёл подобный эксперимент, предложив популярным ИИ-моделям угадать число от 1 до 50. Он протестировал модели OpenAI ChatGPT, Anthropic Claude Sonnet 4, Google Gemini 2.5 Flash и Meta* Llama 4. Все они назвали в качестве ответа «27».

Meta Platforms*, а также принадлежащие ей социальные сети Facebook** и Instagram**:
*признана экстремистской организацией, её деятельность в России запрещена 
**запрещены в России

Читают сейчас

MAX перестал присылать уведомления (пуши) у пользователей на iPhone

20 минут назад

MAX перестал присылать уведомления (пуши) у пользователей на iPhone

Мессенджер MAX перестал присылать уведомления пользователям iOS. Если приложения нет в AppStore, оно не может отправлять пуши на iPhone. В команде мессенджера рекомендуют открывать на смартфонах Apple

27 минут назад

РБК: операторы связи обсуждают с властями функция наладить для россиян доступ к незаблокированным ресурсам без VPN

Операторы связи обсуждают с властями функция наладить для российских пользователей доступ без VPN к нейросетям, Netflix и другим незаблокированным ресурсам в РФ. О такой инициативе рассказал РБК генди

Вышло апдейт RapidRAW 1.5.6 — открытого редактора изображений RAW

1 час назад

Вышло апдейт RapidRAW 1.5.6 — открытого редактора изображений RAW

В начале июня 2026 года состоялся выпуск обновления открытого мультиплатформенного редактора изображений RapidRAW 1.5.6 с улучшенным экспериментальным релизом для планшетов на Android. Проект предлага

Выпуск BATorrent 3.0 — легковесного BitTorrent-клиента, созданного на C++, Qt 6 и libtorrent-rasterbar

5 часов назад

Выпуск BATorrent 3.0 — легковесного BitTorrent-клиента, созданного на C++, Qt 6 и libtorrent-rasterbar

В начале июня 2026 года состоялся третий мажорный выпуск открытого проекта BATorrent — легковесного BitTorrent‑клиента, созданного на C++, Qt 6 и libtorrent‑rasterbar. Версия BATorrent 1.0 состоялся в

5 часов назад

MAX удалили из App Store

Мессенджер MAX пропал из App Store. Просто в один момент В среду, 3 июня, кто-то из пользователей iOS заметил странное: отечественный мессенджер "Макс" не ищется в App Store. Вообще. Ни через поиск, н