GPT-5.5 взял 130 IQ на закрытом тесте TrackingAI

2 мин
GPT-5.5 взял 130 IQ на закрытом тесте TrackingAI

OpenAI GPT-5.5 Pro и GPT-5.5 Thinking набрали по 130 баллов на закрытом IQ-тесте TrackingAI и разделили первое место среди текстовых моделей. На стандартной шкале IQ 130 — это приблизительно граница верхних 2% населения, именно по этому критерию Mensa приглашает кандидатов с одобренного теста.

TrackingAI ведет два теста: публичный Mensa Norway и закрытый Offline Test. Открытый тест доступен в интернете, поэтому его вопросы, ответы или разборы могли попасть в обучающие информация моделей. Offline Test, по словам авторов проекта, составил участник Mensa; эти вопросы не публиковались в сети и не должны были попасть в обучение ИИ. Поэтому приватный тест интереснее как тест способности решать новые задачи, а не узнавать уже виденные закономерности.

Еще одна важная деталь: TrackingAI отдельно прогоняет модели в текстовом режиме с включенным компьютерным зрением. Первым IQ-задачи описывают словами, а вторым показывают изображение задания. Следовательно результаты нельзя смешивать в одну общую таблицу: текстовая схема зависит от качества описания, а схема с компьютерным зрением тестируется еще и на способность самостоятельно прочитать визуальную задачу.

Именно в связи с этих разделений GPT-5.5 нельзя просто объявить "самым умным ИИ". На закрытом Offline Test текстовые GPT-5.5 Pro и GPT-5.5 Thinking лидируют, но на публичном Mensa Norway среди текстовых моделей GPT-5.5 Thinking не начальный: выше в таблице стоят Grok-4.20 Expert Mode, Gemini 3.1 Pro Preview и Claude-4.7 Opus Extended Thinking. Кроме того, этот формат проверяет прежде всего абстрактную логику, а не программирование, научную работу, надежность или работу в роли агента.

Аккуратный вывод такой: GPT-5.5 стал лидером важной части IQ-рейтинга TrackingAI, особенно на закрытом наборе задач. Это сильный результат для задач на абстрактное мышление, но не универсальное доказательство превосходства над всеми ИИ во всех возможных тестах.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

18 минут назад

РКН изменил решение к блокировке VPN. Теперь проблемы с доступом появились у российских облачных сервисов и сайтов

Как мы знаем, некоторые VPN‑сервисы маскируют трафик под легальные российские ресурсы, используя для этого мощности отечественных облачных провайдеров. Несколько провайдеров, в том числе Selectel, Beg

28 минут назад

Google значительно снизила стоимость своей бюджетной подписки на ИИ — до $4,99 в месяц

Google снизила стоимость бюджетного тарифа Google AI Plus с $7,99 до $4,99 в месяц, одновременно удвоив объём облачного хранилища — с 200 до 400 ГБ. Об изменениях сообщил в X руководитель продукта Gem

Microsoft показала юбилейную версию Xbox Series X в полупрозрачном зелёном корпусе

28 минут назад

Microsoft показала юбилейную версию Xbox Series X в полупрозрачном зелёном корпусе

Microsoft представила специальную версию Xbox Series X в полупрозрачном зелёном корпусе в честь 25-летия консоли. Юбилейное устройство получило название Xbox Series X25. Ознакомиться далее

Показываем классный мерч Иви

43 минуты назад

Показываем классный мерч Иви

Продолжаем показывать классный мерч Иви🤩 На канале «Не о дизайне» вышла распаковка велкам-паков нескольких компаний — и наш среди них! Автор честно представил, что первым делом получает новичок в Иви

В «Нейроюристе» от «Яндекса» появилась опция подготовки ответов на претензии

55 минут назад

В «Нейроюристе» от «Яндекса» появилась опция подготовки ответов на претензии

В сервисе «Нейроюрист» от «Яндекса» запустили новую функцию «Ответ на претензию», которая даёт возможность подготовить проект ответа на обращение за 3–10 минут вместо 30–60 минут, обычно требующихся д