18 апреля 2026, 13:36
Claude Opus 4.7 достигла 1-го места на Artificial Analysis

Artificial Analysis опубликовала результаты тестирования Claude Opus 4.7. В соответствии с отчёту, новая нейросеть разделила первое место в Индексе искусственного интеллекта (Artificial Analysis Intelligence Index) с GPT-5.4 (OpenAI) и Gemini 3.1 Pro (Google), набрав 57,3 балла против 57,2 и 56,8. С учётом погрешности в ±1 балл эксперты заявляют о трёхсторонней ничьей – впервые в истории платформы.
Главная гордость Opus 4.7 – бенчмарк GDPval-AA, который измеряет способность модели выполнять реальную работу агента в 44 профессиях и 9 отраслях. Здесь Claude Opus 4.7 набрала 1 753 Эло, оставив позади Claude Sonnet 4.6 (1674) и GPT-5.4 (1673). Отрыв от собственной предшественницы Opus 4.6 (1619) составил 134 пункта.

В дополнение к этого, Opus 4.7 заняла второе место в индексе Omniscience от Artificial Analysis – сразу после Gemini 3.1 Pro. И это достижение обеспечено резким снижением галлюцинаций на 25 пп. – с 61% у Opus 4.6 до 36%. Схема стала чаще воздерживаться от ответа, если не уверена: процент попыток ответить упал с 82% до 70%. Точность при этом осталась на том же уровне.

Ещё один сюрприз – экономичность. Прогон полного набора тестов Intelligence Index для Opus 4.7 обошёлся приблизительно в 4406 $, что на 11% дешевле, чем для Opus 4.6 (приблизительно 4970 $). Одновременно схема набрала на 4 балла выше и использовала на 35% меньше выходных токенов – 102M против 157M. Для сравнения: GPT-5.4 (xhigh) потратила 121M токенов, а Gemini 3.1 Pro – всего 57M.

По остальным бенчмаркам динамика главным образом положительная: прирост в IFBench (+5,5 пп.), TerminalBench Hard (+5,3 пп.), HLE (+2,9 пп.), SciCode (+2,6 пп.) и GPQA Diamond (+1,8 пп.). Единственное заметное падение – в тесте τ²-Bench (−3,5 пп.).

Что нового в программный интерфейс наряду с Opus 4.7
Anthropic внесла некоторое количество изменений:
Свежий уровень размышлений
xhigh– междуhighиmax. Теперь доступныlow,medium,high,xhighиmax.Бюджет для задач (публичная бета) – модель получает ориентировочный бюджет токенов на весь агентный цикл (мышление, вызовы инструментов, результаты, вывод). Opus 4.7 видит обратный отсчёт и может приоритизировать работу, завершая задачи “грациозно”.
Полное удаление extended thinking – остался только режим adaptive reasoning.
Характеристики модели не изменились: контекстное окно 1M токенов, максимум вывода 128K токенов.
Сравнить Opus 4.7 с другими лидерами можно на официальной странице Artificial Analysis.
Читают сейчас

5 минут назад
Премия «Хакатоны России»: номинируй свое соревнование, команду или стань экспертом
Стартовал третий сезон Премии «Хакатоны России». Номинируй свой хакатон или IT-соревнования, заяви команду или сам стань экспертом. Заявки до 18 июня, церемония 3 июля в Москве. Подробности внутри 👇

36 минут назад
11 июня ждем тебя на ux AI встреча в Питере и в интернете
В этом месяце проведем совместный ивент с комьюнити «Чат рисерчеров» про исследования, маркетинг и AI. Программа и регистрация

46 минут назад
Nemotron 3 Ultra стала самой мощной открытой моделью из США
Nvidia анонсировала открытую MoE-модель Nemotron 3 Ultra с архитектурой на 550 млрд параметров, из которых 55 млрд активны при генерации. По оценке Artificial Analysis, схема обошла Gemma 4 и gpt-oss-

1 час назад
Тело — китайское, мозг — от NVIDIA: вышел начальный гуманоид на открытой платформе
NVIDIA на конференции GTC в Тайбэе представила Isaac GR00T Reference Humanoid Robot — начальный открытый референсный дизайн человекоподобного робота. Тело ему дали китайская Unitree (шасси H2 Plus) и

1 час назад
К2Тех и МТС Web Services объединяют усилия для развития доверенного генеративного ИИ в российских компаниях
Компании К2Тех и МТС Web Services (далее — MWS) стали технологическими партнерами. Соглашение о партнерстве было заключено на конференции ЦИПР-2026. Предметом соглашения стало совместное внедрение AI-