Anthropic Economic Index: автономность Claude Code, опрос пользователей и новая методология

4 мин
Anthropic Economic Index: автономность Claude Code, опрос пользователей и новая методология

Anthropic опубликовала шестой версия Economic Index, в котором компания не только обновила методологию сбора данных, но и в начальный раз провела масштабный опрос пользователей. Основной вывод, который переворачивает представление о том, как мы взаимодействуем с ИИ: на уровень автономии влияет не столько модель, сколько оболочку и среда выполнения задачи.

Что изменилось в методологии

Ранее организация полагалась на семидневные срезы данных. В новом отчёте выборка стала ежечасной. Это позволило в деталях проследить не только недельные паттерны (всплеск личных запросов на выходных), но и суточные ритмы: например, пик запросов рецептов приходится на 18:00, а просьбы о помощи со сном — на 3–5 утра.

Равным образом в отчёте в начальный раз разделены метрики для трёх поверхностей:

  • Веб-чат и Cowork (классический диалог);

  • Claude Code (агентная среда для разработчиков);

  • 1P программный оболочку (прямые интеграции).

Ключевой инсайт: продукт важнее модели

Исследователи замеряли уровень автономии, которую пользователь делегирует ИИ, по шкале от 1 до 5 (от «никакой» до «экстремальной»).

Оказалось, что в Claude Code пользователи отдают моделям значительно больше контроля, чем в обычном чате или Cowork.

Цифры:

  • Средний разрыв в уровне автономии в пользу Claude Code по всем задачам — +0,37 балла.

  • Для задач, связанных с программированием, отрыв ещё выше — +0,53 балла.

  • В 26 из 31 категории результатов агентный оболочку Claude Code превосходит обычный чат по этому показателю.

Самый наглядный пример: чтобы написать статью или пост в веб-чате, пользователю требуется в среднем 13 раундов диалога. В Claude Code та же проблема решается одним промптом.

Логично было бы списать этот эффект на то, что в Claude Code чаще используются более мощные модели (54% сессий обслуживает Opus против 10% в чате). Тем не менее авторы отчёта провели вспомогательный анализ и выяснили: даже при сравнении сессий на одной и той же модели Sonnet разница сохраняется. Claude Code всё равно демонстрирует на 0,26 балла больше автономии.

То, насколько мы готовы отпустить руль, зависит не от «интеллекта» модели, а от того, как упакован продукт и какую степень доверия оболочку внушает пользователю.

Дороже задача — дороже токены

Отчёт подтверждает корреляцию между сложностью (ценностью) задачи и затратами вычислительных ресурсов.

  • В задачах, относящихся к высокооплачиваемым профессиям (маркетинг, программирование), Claude потребляет в 2,07 раза больше токенов, чем в низкооплачиваемых.

  • Корреляция между уровнем делегирования (автономией) и количеством токенов чрезвычайно высока: r = 0,68.

  • Парадоксально, но в дорогих задачах пользователи не отключаются: они делают на53% больше запросов и на 34% чаще включают режим Extended Thinking.

То есть полная передача управления не означает пассивности пользователя — в ответственных сценариях человек остаётся в контуре, но переключается на контроль более высокого уровня.

Что представил опрос 9700 пользователей

В первый раз Anthropic привязала информация телеметрии к субъективным ответам респондентов (выборка — 9700 человек, у которых было минимум 5 сессий).

Автоматизация ≠ страх

Основной сюрприз: пользователи, которые делегируют Claude больше всего задач (высокая доля автоматизированных сессий), оказались самыми оптимистичными. Они чаще других ожидают роста зарплаты, сохранения работы или увеличения рыночной ценности своих навыков.

Одновременно именно они видят, что ИИ уже сегодня способен взять на себя большую часть их рабочих задач некоторых - полностью).

Гендерное различие

Женщины (которых в выборке 12%) используют Claude иначе, даже с поправкой на профессию:

  • Доля сессий в Claude Code у них на 6,3 п.п. ниже (0,24 стандартного отклонения).

  • Уровень автоматизации ниже на 7,3 п.п. (0,33 стандартного отклонения).

  • Зато они проводят в чате больше активного времени и взаимодействуют с моделью более итеративно, как с партнёром-собеседником.

Мужчины же чаще пытаются «сбросить» задачу полностью и забыть о ней.


Что в итоге

Доклад Anthropic демонстрирует, что экосистема ИИ стремительно эволюционирует от «диалогового окна» к агентным средам, где модель может функционировать часами автономно. Однако основной барьер сейчас — не возможности моделей, а оболочку и доверие пользователя.

Ключевые тезисы для разработчиков и продуктовых команд:

  1. Агентный оболочку (как в Claude Code) кардинально меняет паттерн взаимодействия, сокращая число итераций с 13 до 1.

  2. Эффект автономии не сводится к выбору более умной модели — он зашит в пользовательский опыт.

  3. Пользователи, которые готовы делегировать больше, не боятся потери работы, а наоборот, видят в этом увеличение собственной ценности.

  4. Высокая автономия требует больших вычислительных затрат — и эта корреляция будет только усиливаться.

Ссылка на оригинальный отчёт: Anthropic Economic Index: Cadences

Читают сейчас

Fujifilm представила две новые модели одноразовых плёночных фотоаппаратов QuickSnap

1 час назад

Fujifilm представила две новые модели одноразовых плёночных фотоаппаратов QuickSnap

Японская Fujifilm расширяет линейку QuickSnap двумя новыми одноразовыми плёночными фотоаппаратами: QuickSnap Black and White и QuickSnap Active. Первая схема за $23 предназначена для чёрно-белой съёмк

Selectel запускает ИТ-кроссворд

2 часа назад

Selectel запускает ИТ-кроссворд

6 июля запускаем ИТ-кроссворд — онлайн-соревнование для всех, кто увлечен технологиями и не только. Все вопросы в этом году будут объединены единой концепцией — AI и ML, так что готовьтесь вспомнить н

С 86 до 26 баллов в отладке кода: Claude Fable 5 обвалилась в бенчмарках в связи с новых фильтров

2 часа назад

С 86 до 26 баллов в отладке кода: Claude Fable 5 обвалилась в бенчмарках в связи с новых фильтров

Команда BridgeMind перепрогнала вернувшуюся Claude Fable 5 на своем бенчмарке BridgeBench — и июльская версия модели показала результаты в разы хуже июньских. В отладке кода Fable 5 упала с 86,2 до 25

Скринкасты с демонстрацией работы INTEKEY WMS: от настройки топологии до интерфейсов ТСД

2 часа назад

Скринкасты с демонстрацией работы INTEKEY WMS: от настройки топологии до интерфейсов ТСД

Обычно изучение интерфейса и логики работы WMS-системы требует предварительного общения с представителями вендора и организации отдельных встреч для показа системы. Чтобы упростить процедура первичног

Schneider Electric купила за $3,1 млрд компанию Cognite Holding, специализирующуюся на системах промышленного ИИ

2 часа назад

Schneider Electric купила за $3,1 млрд компанию Cognite Holding, специализирующуюся на системах промышленного ИИ

Французская энергомашиностроительная организация Schneider Electric приобрела за $3,1 млрд норвежскую компанию Cognite Holdings, которая специализируется на системах промышленного искусственного интел