36 минут вместо 4,5 часа: как AI-агенты меняют работу пользователей

4 мин
36 минут вместо 4,5 часа: как AI-агенты меняют работу пользователей

Исследователи из Гарварда и Perplexity изучили, что происходит при переходе от AI-поиска к автономному агенту. Для сравнения взяли Perplexity Search и Perplexity Computer – систему, которая может самостоятельно искать информацию, писать код, создавать документы, обращаться к внешним сервисам и делегировать части задачи другим агентам.

Исследование основано на данных за первые три месяца после запуска Computer – с 27 февраля по 27 мая 2026 года. Кумулятивное число запросов за этот период оказалось в 84 раза больше объёма первой недели. В случайной выборке из 100 000 запросов крупнейшими категориями стали исследования и анализ – 25,8%, а также создание документов и других материалов – 18,6%.

Для прямого сравнения разработчики собрали 10 000 пар сессий с почти идентичными начальными запросами. В среднем Computer самостоятельно планировал и выполнял задачу 26 минут, тогда как Search выдавал итог за 33 секунды. Разница в машинном времени составила 48 раз: поиск главным образом предоставлял информацию, а дальнейшие действия оставались пользователю; агент брал исполнение на себя.

После ответа Computer пользователи реже выдавали пошаговые команды и чаще переходили к проверке или расширению результата. Доля запросов, после которых второй ход указывал на среднее или сильное недовольство, составила 1,3% у Computer против 2,9% у Search – на 55% меньше.

Самый заметный результат касается времени. По оценке авторов, связка Search + человек тратила на сопоставимую задачу в среднем 269 минут. В сценарии Computer + человек – 36 минут, включая десять минут на постановку задачи и проверку результата. Расчётная экономия составила 87 процентов времени и 94% стоимости. Стоимость человеческой работы оценивали по средним почасовым ставкам BLS для 18 тематических областей. Чтобы сравняться с агентом по стоимости, специалисту с обычным AI-поиском пришлось бы выполнить все ручные этапы менее чем за 20 минут.

Рассчёт производился ещё двумя способами: с помощью отдельной LLM-процедуры и интервью с 25 активными пользователями Computer. LLM-оценка дала близкие результаты — 84 процентов экономии времени и 93% стоимости. Участники, предоставившие количественные оценки, сообщали об ускорении от 5 до более чем 300 раз. Медиана по участникам составила приблизительно 25 раз.

Агенты меняли и характер запросов. В анализе поведения 8000 пользователей запросы к Computer выходили за границы основной профессиональной области в 59% случаев против 50% у Search. Среди ещё 10 000 запросов агенту чаще поручали абстрактные нерутинные задачи – 71% против 53%. Задачи более высокого уровня по таксономии Блума составляли 76% против 55%, а разработка нового результата – 50% против 26%.

Запрос к Computer в среднем требовал знаний из 2,4 области против 1,74 у Search. Три области и более затрагивали 51 процентов запросов к агенту и 17 процентов запросов к поиску. Среди запросов, сопоставленных с конкретными рабочими операциями, 23 процентов включали действия, которые вообще не встречались в Search-запросах тех же пользователей.

Но цифры нельзя считать универсальной оценкой эффективности AI-агентов. Исследование охватывает ранних пользователей, среди которых непропорционально много продвинутых и платящих подписчиков. Сравнение по идентичным запросам относится только к задачам, встречавшимся в обоих продуктах. Расчёты времени зависят от предполагаемой длительности ручных операций, десяти минут человеческого контроля и оценок LLM. Классификация сложности задач также выполнялась языковыми моделями. Трое из четырёх авторов работают в Perplexity, а исследование рассматривает поведение только внутри её экосистемы.

Авторы считают, что основной сдвиг связан не только с ускорением работы. Потребитель переходит от ручного выполнения отдельных шагов к постановке задачи, контролю и проверке результата. Сохранится ли этот эффект за пределами выборки ранних пользователей – или исследование показывает верхнюю границу возможностей тех, кто уже умеет делегировать работу агентам?

Тему AI-агентов можно продолжить на бесплатных уроках. Преподаватели-практики покажут, как AI уже меняет разработку и исследовательскую работу, а заодно можно будет задать свои вопросы:

  • 22 июня, 20:00. «AI-агенты против младших разработчиков: кто кого заменит к концу 2026 года». Записаться

  • 29 июня, 20:00. «Обзор AI-технологий для разработчиков: от идей до рабочих решений». Записаться

Читают сейчас

В ESET обнаружили два варианта бэкдора SprySOCKS для Windows

33 минуты назад

В ESET обнаружили два варианта бэкдора SprySOCKS для Windows

Исследователи ESET обнаружили два варианта SprySOCKS для Windows — бэкдора, который ранее был известен только в среде Linux. Распространение SprySOCKS связывают с китайской группировкой FishMonger, ко

Рыночная доля ChatGPT упала ниже 50% — одновременно чат-бот продолжает ставить рекорды

37 минут назад

Рыночная доля ChatGPT упала ниже 50% — одновременно чат-бот продолжает ставить рекорды

Спустя три с половиной года после запуска ChatGPT в начальный раз в истории опустился ниже 50% мирового рынка ИИ-ассистентов. Об этом пишет TechCrunch со ссылкой на отчет Sensor Tower "State of AI 202

Sharp показала флагманский телефон Aquos R11

40 минут назад

Sharp показала флагманский телефон Aquos R11

Sharp презентовала флагманский телефон Aquos R11 с процессором Qualcomm Snapdragon 8s Gen 4. Продажи устройства за $1 тыс. стартуют в Японии с 9 июля 2026 года. Производитель пока не раскрыл стоимость

NASA отправит космический буксир спасать телескоп Swift

51 минуту назад

NASA отправит космический буксир спасать телескоп Swift

Космический телескоп Neil Gehrels Swift Observatory, вот уже более 20 лет наблюдает гамма-всплески — самые мощные взрывы во Вселенной. Все бы хорошо, но есть одна проблема — он постепенно теряет высот

Adobe и Walt Disney Imagineering разработали кастомные ИИ‑модели для проектирования тематических парков

56 минут назад

Adobe и Walt Disney Imagineering разработали кастомные ИИ‑модели для проектирования тематических парков

Adobe и Walt Disney Imagineering совместно разработали систему генеративного ИИ, который предназначен для использования при проектировании тематических парков Disney. В основе — кастомные модели на ба