70% новых статей по программной инженерии на ArXiv связаны с LLM

3 мин
70% новых статей по программной инженерии на ArXiv связаны с LLM

Данные о статьях, опубликованных с 2022 года на сервисе препринтов ArXiv, показывают, что в области программной инженерии лидирует тема LLM (больших языковых моделей). На них приходится 70% новых материалов.

Серверы препринтов предлагают быстрый путь к публикации. Исследователь загружает статью, и она появляется на следующий день, а рецензируемая версия выходит позже. Итак, данные о публикациях в препринтах дают наиболее точное представление об исследовательских темах в реальном времени. 

arXiv — это главный архив открытого доступа для исследовательских статей в области вычислительной техники, физики, математики и различных инженерных областях. Подкатегория программной инженерии — cs.SE. Пакет Python arxivscraper использует программный интерфейс arXiv для получения метаданных, связанных со статьями, опубликованными на сайте. Эта приложение позволила энтузиасту извлечь 15 899 статей, опубликованных в подкатегории cs.SE с 1 января 2022 года.

На графике ниже показан процент статей, опубликованных каждый месяц, заголовок которых (без учёта регистра) соответствует либо выражению «llm», либо «большая языковая модель»: 

Пик популярности заголовка «Большая языковая модель», по-видимому, пришёлся на конец 2024 года. А вот пик популярности LLM в заголовках статей пришёлся на конец 2025 года.

Аннотация статьи кратко излагает её содержание и предоставляет достаточно места для более подробного текста. На графике ниже показан процент статей, публикуемых каждый месяц, аннотация которых (без учёта регистра) соответствует либо выражению «llm», либо «large language model»: 

Пик или плато популярности LLM, по-видимому, приходятся на конец 2025-го. О том, начался ли спад тренда, можно будет сказать только к концу этого года.

Другие термины, связанные с LLM, — это ИИ, искусственный интеллект и агенты. На графике ниже показан процент статей, публикуемых каждый месяц, заголовок которых соответствует каждому из выражений «llm|large language model», или «ai[ ,.)]|artificial intellig», или «agent»: 

Подсчёт статей, содержащих одну или несколько из этих фраз, связанных с LLM, даёт оценку количества материалов по программной инженерии, изучающих тему. На графике ниже показан процент статей, публикуемых каждый месяц, заголовок или аннотация которых соответствуют одному или нескольким выражениям «llm|large language model», или «ai[ ,.)]|artificial intellig», или «agent»: 

Если темпы роста останутся неизменными, примерно через 18 месяцев 100% статей, публикуемых в подкатегории cs.SE на arXiv, будут связаны с LLM.

Однако автор ожидает замедления темпов роста. По его мнению, рост остановится, не достигнув 100%, а пока метрика держится на отметке чуть выше 70%.

Между тем сама система ArXiv осенью объявила, что больше не будет принимать обзорные статьи и аналитические доклады по информатике, которые не были рецензированы и приняты академическим журналом или конференцией. Изменение правил обусловлено наводнением этой категории низкопробными статьями, созданными при помощи искусственного интеллекта.

Читают сейчас

Московский НИИ радиосвязи сделал спутниковую антенну «Эфир-600» для связи и доступа в интернет в самолётах и на кораблях

19 минут назад

Московский НИИ радиосвязи сделал спутниковую антенну «Эфир-600» для связи и доступа в интернет в самолётах и на кораблях

Инженеры Московского НИИ радиосвязи (МНИИРС) разработали спутниковую антенну под названием «Эфир-600». Девайс предназначено для обеспечения российских авиакомпаний широкополосной связью и доступом в и

xAI начала отправлять инженеров в офисы корпоративных клиентов

24 минуты назад

xAI начала отправлять инженеров в офисы корпоративных клиентов

ИИ-стартап xAI Илона Маска теперь отправляет инженеров прямо в офисы потенциальных корпоративных клиентов. Итак компания пытается ускорить добавление своих решений и отвоевать долю рынка у OpenAI и An

Ранний прототип сегвея выставлен на аукцион

26 минут назад

Ранний прототип сегвея выставлен на аукцион

На сайте аукционного дома RR Auction представили прототип сегвея под кодовым названием Ginger. Торги за лот из коллекции бывшего президента и генерального директора компании Segway Джеймса Норрода зав

Uber начала сотрудничать с компаниями роботакси для борьбы с монополией

54 минуты назад

Uber начала сотрудничать с компаниями роботакси для борьбы с монополией

За последние некоторое количество недель Uber объявила о трёх новых партнёрствах в сфере роботакси с Zoox, Wayve-Nissan и Rivian. Менее чем за пять лет организация заключила как минимум дюжину сделок,

Первая строчка Markswebb: ПСБ стал лучшим интернет-банком для бизнеса

58 минут назад

Первая строчка Markswebb: ПСБ стал лучшим интернет-банком для бизнеса

По итогам 2025 года года ПСБ получил независимую премию Markswebb в номинации «Лучший интернет-банк для малого и микробизнеса», победив с наивысшим баллом за все время существования рейтинга. Ознакоми