Исследование Jellyfish: при высоком уровне внедрения ИИ объём выпускаемого кода удваивается при сохранении качества

3 мин
Исследование Jellyfish: при высоком уровне внедрения ИИ объём выпускаемого кода удваивается при сохранении качества

Платформа Jellyfish провела исследование с участием более 700 компаний, 200 тысяч инженеров и 20 млн запросов на слияние (pull requests). Он выявил, что производительность растёт, но без сильной потери качества кода.

В компаниях, включённых в набор данных, средний уровень использования инструментов ИИ составляет 63%, а 64% компаний теперь генерируют большую часть своего кода с помощью технологии. По данным Jellyfish, еженедельные показатели использования неуклонно росли на протяжении последнего года, одновременно увеличивалась доля инженеров, использующих инструменты ИИ для кодирования несколько дней в неделю.

Наибольшее влияние это оказывает на производительность. Компании с самым высоким уровнем внедрения ИИ — где от 75% до 100% инженеров используют инструменты его для кодирования три или более дней в неделю — объединяли в среднем 2,2 запроса на слияние на одного инженера в неделю. Это почти вдвое больше, чем 1,12 PR у других компаний.

Руководитель исследовательского отдела Jellyfish Николас Арколано отметил, что перестал писать код сам осенью 2025 года, передав эту работу инструментам ИИ. Около в это же время значительные улучшения моделей сделали инструменты для программирования на основе ИИ намного лучше, и их использование действительно резко возросло. Арколано называет этот момент «Рождеством Claude», когда многие инженеры-программисты открыли для себя истинную мощь сервиса Claude Code от Anthropic и стартовали экспериментировать с ним во время праздников. 

Другие популярные инструменты для разработки ИИ, используемые инженерами, включают Codex от OpenAI, Cursor и GitHub Copilot.

В соответствии с данным Jellyfish, качество кода, похоже, не снижается под тяжестью более высокой производительности. Показатели отката увеличиваются только незначительно по мере роста внедрения ИИ среди инженеров-программистов, с 0,61% в компаниях с низким уровнем внедрения до 0,65% в компаниях высшего уровня.

«Мы не наблюдаем значительного влияния на качество. За этим нужно будет следить в дальнейшем. Проблемы с качеством и попытки удержать ситуацию под контролем в условиях растущего давления со стороны необходимости ускорять процессы, а также узким местом становится возможность проверки кода ИИ», — сказал Арколано.

Тем временем появляются более продвинутые способы использования ИИ. Активность автономных агентов по-прежнему составляет небольшую долю общей работы, но быстро растёт, особенно среди ведущих разработчиков.

Арколано больше всего поразили различия между организациями, которые полностью внедряют агентов ИИ в программирование, и другими, которые практически ничего не делают в этой новой области. «Разрыв ускоряется. Поэтому люди внизу не двигаются, а люди в середине постепенно продвигаются. Люди наверху находятся на ракете и стремительно развиваются», — сказал он. 

Между тем исследование Alibaba Group и Университета имени Сунь Ятсена в Гуанчжоу показало, что современные нейросети не могут поддерживать долгосрочную эволюцию кодовой базы, добавляя новые функции и не нарушая функциональность старых. Оценка включала 18 моделей от 8 разных поставщиков. Выяснилось, что в рамках одного семейства более новые модели всегда достигают более высоких показателей, при этом выпущенные после начала 2026 года демонстрируют значительно больший прирост, чем их предшественники.

В дополнение к этого, исследователи проанализировали сотни опенсорсных репозиториев с внедрённым инструментом и без него. Стало известно, что ИИ сначала разгоняет поток кода, а потом раздувает технический долг.

Читают сейчас

В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец

9 минут назад

В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец

В подсистеме подключения устройств OpenClaw — ИИ-агента с 348 000 звезд на GitHub — за шесть недель обнаружили шесть уязвимостей класса CWE-863 (некорректная авторизация). Последняя, CVE-2026-33579 с

В Steam тестируют аналитика FPS на конкретном ПК до покупки игры пользователем

28 минут назад

В Steam тестируют аналитика FPS на конкретном ПК до покупки игры пользователем

Valve тестирует в Steam средство для анализа FPS на конкретном ПК до покупки игры пользователем, сообщил датамайнер dex3108 на форуме ResetEra, обнаруживший строки кода этой функции. Сама организация

Microsoft вложит $10 млрд в японские ИИ-проекты

1 час назад

Microsoft вложит $10 млрд в японские ИИ-проекты

До 2029 года Microsoft планирует инвестировать $10 млрд в инфраструктуру искусственного интеллекта и облачных вычислений Японии, пишет местное информационное агентство Kyodo News со ссылкой на вице-пр

В космическом корабле «Орион» снова сломался туалет — теперь там промерзает трубопровод и образуется засор

1 час назад

В космическом корабле «Орион» снова сломался туалет — теперь там промерзает трубопровод и образуется засор

Спустя трое суток полёта экипаж миссии «Артемида» II на космическом корабле «Орион» снова столкнулся с неполадками в работе бортового туалета (универсальной системы управления отходами — Universal Was

В Великобритании подросток решил раздеться перед Gemini Live в режиме камеры, после этого ИИ убрал все аккаунты семьи

3 часа назад

В Великобритании подросток решил раздеться перед Gemini Live в режиме камеры, после этого ИИ убрал все аккаунты семьи

В Великобритании 14-летний подросток решил раздеться перед голосовым помощником Gemini Live с доступом к камере планшета. В итоге искусственный интеллект удалил все аккаунты семьи и документы родителе