OpenAI замерила работу Codex: агенты уже берут задачи на часы, но есть нюансы

5 мин
OpenAI замерила работу Codex: агенты уже берут задачи на часы, но есть нюансы

OpenAI опубликовала исследование о том, как используют Codex — агентный средство для разработки и смежных рабочих задач. По данным компании, пользователи всё чаще поручают ему не короткие вопросы, а задачи, которые в обычном режиме могли бы занять десятки минут или часы.

Но сразу стоит оговориться: это не статистика по всему рынку и не доказательство, что агенты уже массово заменяют разработчиков. Часть оценок строится на выборках, длительность задач определялась с помощью языковой модели, а внутренняя среда OpenAI слишком специфична, чтобы переносить её на обычные компании без поправок.

Что изучала OpenAI

В исследовании сравнивали три группы пользователей Codex: индивидуальные аккаунты, корпоративных пользователей и сотрудников самой OpenAI. Codex здесь рассматривается не как чат для подсказок, а как агент: ему можно поручать действия с кодовой базой, файлами, окружением и результатами работы.

Хотя средство изначально был заточен под разработку, его используют шире: для анализа данных, подготовки документов, настройки окружений, работы с репозиториями, отладки и проверки изменений. То есть Codex постепенно выходит за рамки сценария «помоги написать код».

Задачи становятся длиннее

Самая заметная цифра из отчёта: к маю 2026 года 80,6% пользователей из анализируемой индивидуальной выборки хотя бы раз отправляли в Codex запрос, который модель оценила как задачу дольше 30 минут человеческой работы. 70,2% — как задачу дольше часа. 25,6% — как задачу дольше восьми часов.

Это не означает, что Codex стабильно выполняет полноценный рабочий день за человека. Скорее видно изменение формата: пользователи всё чаще формулируют задачу крупнее. Не «объясни фрагмент кода», а «разберись с проблемой, внеси изменения, проверь и верни результат».

Методологически это слабое место исследования. Длительность не измерялась напрямую — её оценивала языковая модель по тексту запроса. В дополнение к этого, этот фрагмент анализа основан на случайной выборке 0,1% индивидуальных аккаунтов, которые разрешили применять свои данные для обучения. Так что цифры лучше воспринимать как направление, а не как точный замер сэкономленного времени.

Внутри OpenAI переход к агентам заметнее всего

В самой OpenAI Codex, судя по данным компании, почти вытеснил ChatGPT в рабочих сценариях. На 11 июня 2026 года на Codex приходилось 99,8% выходных токенов, сгенерированных сотрудниками OpenAI в Codex и ChatGPT для рабочих задач. У корпоративных пользователей вне OpenAI эта доля составляла 63,3%, у индивидуальных — 16,5%.

Но OpenAI — не типичная организация. У сотрудников высокий уровень экспертизы в ИИ, есть внутренняя сопровождение, привычка работать с такими инструментами и, в соответствии с заявлению авторов, нет жёстких количественных ограничений на использование. В обычной ИТ-команде картина будет зависеть от доступа к данным, прав, процессов ревью, требований безопасности и качества самой кодовой базы.

Следовательно внутренние показатели OpenAI скорее показывают, как может выглядеть продвинутое использование агентов, а не «среднюю температуру» по рынку.

Codex используют не только авторы

OpenAI отдельно отмечает увеличение использования Codex неразработчиками. Среди индивидуальных пользователей их число выросло в 137 раз с августа 2025 года, среди корпоративных — в 189 раз, внутри OpenAI — в 12 раз.

Это не значит, что все роли внезапно начали писать продакшен-код. Речь скорее о технических задачах вокруг работы: обработке данных, автоматизации, подготовке документов, анализе, настройке вспомогательных инструментов. Внутри OpenAI Codex используют не только в разработке, но и в исследованиях, планировании, коммуникациях, рекрутинге, продажах и продуктовой работе.

Для компаний здесь важен более практичный вывод: агентные инструменты могут снижать порог входа в задачи, которые раньше приходилось отдавать инженерной команде или откладывать до появления свободного разработчика.

Пользователь становится диспетчером задач

Один из признаков более зрелого использования агентов — параллельные запуски. Потребитель может держать несколько задач в работе и подключаться только для уточнений, проверки или исправлений.

Снаружи OpenAI это пока не стало массовым сценарием. В исследовании указано, что 67,4% корпоративных пользователей и 63,9% индивидуальных пользователей за наблюдаемую неделю вообще не запускали параллельные задачи. Внутри OpenAI иначе: только 10,7% пользователей работали с одним потоком, а 28,6% запускали пять и более агентов параллельно хотя бы один раз за период наблюдения.

Это хорошо демонстрирует разницу между ранними пользователями и массовым применением. Агентный ИИ в таком режиме — уже не справочник и не автодополнение, а рабочий контур, где человек ставит задачи, следит за несколькими ветками и проверяет результат.

Шаблоны и повторяемые сценарии становятся важнее

Ещё один метрика зрелости — использование повторяемых инструкций, навыков и подключаемых сценариев. OpenAI называет их skills и plugins.

За неделю до 11 июня 2026 года хотя бы один такой навык использовали 25,7% активных индивидуальных пользователей Codex и 30,4 процентов активных корпоративных пользователей. Внутри OpenAI доля была намного выше — 96,2 процентов. В общем и целом среди активных пользователей Codex доля тех, кто применял навыки, выросла с 5,4% на 1 марта 2026 года до 26,6 процентов на 11 июня.

Практический смысл понятен: агент становится полезнее, когда ему не надо каждый раз заново объяснять структуру проекта, правила команды, формат результата и порядок действий. Для компаний это, вероятно, будет важнее самого факта доступа к модели.

Что из этого следует

Исследование не доказывает, что агенты уже заменяют разработчиков или офисных сотрудников. Оно демонстрирует иной сдвиг: пользователи начинают поручать ИИ более крупные куски работы, а роль человека постепенно смещается к постановке задачи, проверке результата и управлению несколькими потоками.

Для разработчиков это повышает ценность навыков, которые не сводятся к написанию кода: умения формулировать задачу, ознакомиться изменения, проверять вывод модели, проектировать безопасный процесс и понимать ограничения инструмента.

Для компаний вопрос тоже не только в том, чтобы «дать доступ к ИИ». Агент, который может менять файлы, запускать команды и функционировать с внутренним контекстом, требует понятных прав, журналирования, ревью и ответственности за результат.

Следовательно новость не столько про увеличение Codex. Важнее то, что меняется сама единица работы: пользователь всё чаще просит не ответ, а выполненную задачу. Но насколько быстро такой сценарий выйдет за пределы компаний уровня OpenAI, пока открытый вопрос.


В продолжение темы — несколько материалов о том, как ИИ-агенты ведут себя в разработке, где у них начинаются проблемы и какие подходы помогают сделать их полезнее на практике:

Читают сейчас

Selectel запускает ИТ-кроссворд

22 минуты назад

Selectel запускает ИТ-кроссворд

6 июля запускаем ИТ-кроссворд — онлайн-соревнование для всех, кто увлечен технологиями и не только. Все вопросы в этом году будут объединены единой концепцией — AI и ML, так что готовьтесь вспомнить н

С 86 до 26 баллов в отладке кода: Claude Fable 5 обвалилась в бенчмарках в связи с новых фильтров

38 минут назад

С 86 до 26 баллов в отладке кода: Claude Fable 5 обвалилась в бенчмарках в связи с новых фильтров

Команда BridgeMind перепрогнала вернувшуюся Claude Fable 5 на своем бенчмарке BridgeBench — и июльская версия модели показала результаты в разы хуже июньских. В отладке кода Fable 5 упала с 86,2 до 25

Скринкасты с демонстрацией работы INTEKEY WMS: от настройки топологии до интерфейсов ТСД

40 минут назад

Скринкасты с демонстрацией работы INTEKEY WMS: от настройки топологии до интерфейсов ТСД

Обычно изучение интерфейса и логики работы WMS-системы требует предварительного общения с представителями вендора и организации отдельных встреч для показа системы. Чтобы упростить процедура первичног

Schneider Electric купила за $3,1 млрд компанию Cognite Holding, специализирующуюся на системах промышленного ИИ

53 минуты назад

Schneider Electric купила за $3,1 млрд компанию Cognite Holding, специализирующуюся на системах промышленного ИИ

Французская энергомашиностроительная организация Schneider Electric приобрела за $3,1 млрд норвежскую компанию Cognite Holdings, которая специализируется на системах промышленного искусственного интел

OpenAI предложила властям США долю в 5% для защиты бизнеса

57 минут назад

OpenAI предложила властям США долю в 5% для защиты бизнеса

Организация OpenAI, оцениваемая почти в 852 миллиарда долларов, инициировала переговоры о передаче 5% своих акций правительству США. Генеральный директор стартапа Сэм Альтман рассчитывает, что такой ш