Статьи по тегу

1 июня 2026, 00:03

SWE-rebench: Opus 4.8 стал экономнее, но в эффективности уступил GPT-5.5

На майском срезе живого бенчмарка SWE-rebench самой эффективной моделью для программирования стала GPT-5.5 от OpenAI: при сопоставимой с конкурентами цене она решает больше задач, тратя меньше токенов

29 мая 2026, 22:04

GPT-5.5 научили управлять Windows: ИИ-агент Codex кликает мышью и печатает за вас

OpenAI объявила, что опция computer use в Codex теперь работает на Windows. Это значит, что ИИ-агент может функционировать на компьютере так же, как человек: видеть содержимое экрана, перемещать курсо

29 мая 2026, 12:37

OpenAI дала японским банкам доступ к GPT-5.5 для защиты от кибератак

OpenAI предоставила некоторым японским финансовым организациям доступ к своей новой модели GPT-5.5. Об этом сообщила министр финансов Японии Сацуки Катаяма после встречи с директором по стратегии Open

27 мая 2026, 13:49

Свежий тест производительности DeepSWE: GPT-5.5 — 70%, Opus 4.7 — 54%

Новый тест производительности DeepSWE показал, что GPT-5.5 решает 70% задач по разработке ПО, тогда как Claude Opus 4.7 — 54%. На SWE-Bench Pro картина была ровно обратной: там Opus 4.7 занимал первое

27 мая 2026, 10:25

«Opus 4.7 подсматривает ответы!»: Datacurve раскритиковала тест производительности SWE-Bench Pro — и выпустила свой

Claude Opus 4.6 и 4.7 в более чем 12% прогонов на главном агентном бенчмарке кодинга SWE-Bench Pro считывали правильный ответ напрямую из git-истории, лежащей в Docker-контейнере с задачей. GPT-5.4 и

27 мая 2026, 00:27

Британская «красная команда» взломала ChatGPT за 6 часов — а полномочий у нее ноль

Газета New York Times опубликовала репортаж из британского AI Security Institute (AISI) — государственного института на сто человек, который ищет дыры в самых мощных ИИ-моделях. Команде хватило шести

20 мая 2026, 23:21

«Не сетка»: ИИ впервые в истории сам решил центральную проблему геометрии

OpenAI сообщила, что ее внутренняя схема опровергла гипотезу Эрдёша 1946 года о единичных расстояниях — одну из самых известных задач комбинаторной геометрии. Это первый случай, когда центральная откр

18 мая 2026, 13:45

OpenAI запустила ChatGPT для управления финансами с возможностью привязки банковских счетов

OpenAI запустила ChatGPT, предназначенный для управления личными финансами. Пользователи могут привязать к чат-боту свои банковские счета и консультироваться касательно платежей, подписок, инвестиций,

16 мая 2026, 17:35

OpenAI запустила финансовые инструменты в ChatGPT с подключением банковских аккаунтов

OpenAI запустила набор инструментов для персональных финансов в ChatGPT. Пока опция доступна в preview для пользователей ChatGPT Pro в США. Свежий раздел позволяет подключать банковские и инвестиционн