Avito Data Quest: как корпоративный выезд стал игрой для всех желающих

4 мин
Avito Data Quest: как корпоративный выезд стал игрой для всех желающих

Привет, ! Меня зовут Михаил Каменщиков, я руковожу командой Рекомендаций в Авито. Хочу рассказать про штуку, которую мы придумали на выезде — и которая в результате переросла во что-то большее, чем внутренняя шутка команды.

У DS в Авито есть традиция: раз в год мы выбираемся за город, отключаемся от рабочих проектов и делаем что-нибудь совершенно не похожее на обычный день. В тот раз был отель, живая музыка и — неожиданно — долгие разговоры за кофе о том, как объяснить людям вне профессии, чем мы вообще занимаемся.

Потому что объяснять это — правда сложно.

«Ну ты типа в экселе считаешь?»

Каждый DS хоть раз слышал что-то подобное. И каждый раз пытается найти слова.

Хотя, если подумать — наши задачи сами по себе звучат как хорошие истории. Вот несколько примеров из жизни команды Авито.

Мы обучили ML-модель распознавать «договорённости» между продавцами и покупателями в чатах — без данных о реальных сделках. Почему это сложно? Потому что «договоренность» — абстракция: одни пишут «встретимся в пять», другие — «может, подъеду, не знаю». Пришлось собрать вместе бизнес, аналитиков и дата-сайентистов, написать инструкцию, разметить данные вручную, итеративно устранять серые зоны — и в результате получить метрику, которую теперь используют в целеполагании всей компании и A/B-тестах.

Или вот: главная веб-страница Авито — это бесконечная персональная лента объявлений, через которую проходит около 50% всех просмотров и 30% контактов покупателей с продавцами. Казалось бы, просто покажи самое релевантное — и дело сделано. Но если схема ранжирует объявления независимо, она показывает пять одинаковых айфонов подряд. Мы сделали блендер на основе трансформерной модели интересов пользователя — и получили +2,5% пользователей, дошедших до контакта с продавцом. На масштабах Авито это сотни тысяч дополнительных покупателей в сутки.

А ещё у нас есть внутренний BI-инструмент М42 с более чем 16 000 бизнес-метрик. Поиск нужной метрики вручную — боль. Мы встроили ИИ-ассистент на основе RAG и LLM: один из пользователей написал: «ИИ-ассистент нашёл информация с первого запроса. Я их несколько месяцев назад искал почти час. Фантастика!» Построение графиков стало быстрее в два раза.

Объяснить, кто такой датасаентист примерно так же сложно, как и догадаться что же происходит на этом фото с нашего выезда
Объяснить, кто такой датасаентист около так же сложно, как и догадаться что же происходит на этом фото с нашего выезда

Вот чем практически занимаются дата-сайентисты: детективные расследования в данных, поиск сигнала в шуме, объяснение абстракций через цифры — и постоянный баланс между «работает в теории» и «работает в проде».

Игровой подход работает — и мы знаем это на собственном опыте

На том же выезде гвоздём программы был хакатон по управлению беспилотными автомобилями, реализованный с помощью симулятора CARLA. Звучит как «опять дедлайны» — и да, поначалу скепсис был. «Мы и так целый год обучали модели, дайте просто отдохнуть», — думал каждый второй.

Но сработало идеально. Задача вне домена Авито, команды из разных отделов, которые в обычной жизни пересекаются редко, — и вдруг за кофе-брейком обсуждаешь не задачи поиска, а почему твоя машина в симуляторе устраивает токийский дрифт вместо того, чтобы ехать по полосе.

Финал с голосованием и жюри дал больше живых эмоций, чем любая ретроспектива.
Финал с голосованием и жюри дал больше живых эмоций, чем любая ретроспектива.

Вот тогда и стало окончательно понятно: игровой формат — это не «несерьёзно». Это просто иной способ думать о сложном.

Так появился Avito Data Quest

Мы взяли повседневные задачи DS-специалистов и упаковали их в интерактивный квест. Три блока:

базовый ML и Python — можно ли с вами разговаривать на одном языке?
ситуативные задачи — здесь нужны опыт и интуиция, хотя иногда хватает смекалки;
Марио — Data Scientist — да, тот самый Марио, только теперь он аналитик данных и бежит по офису Авито. Можно заработать подсказку 50 на 50.

После трёх блоков — выбор направления и хардовые вопросы по нему. Новейший кейс мы намеренно сделали нетривиальным: это то, что заставляет по-настоящему думать, а не просто вспоминать.

Небольшой честный спойлер: часть вопросов мы используем на реальных собеседованиях. Так что это не просто квиз — это что-то вроде демо-режима перед интервью, только без стресса и галстука.

Почему именно Марио — отдельный разговор

Потому что мы его любим. Но раз уж вы айтишники — вот факт, который всё объясняет: оригинальная игра помещалась на картридже объемом 40 килобайт (32 КБ на код, 8 КБ на графику). Это меньше, чем весит средняя иконка приложения. Одновременно — более чем 50 миллионов проданных копий, а вся серия вплотную подходит к отметке 1 миллиард.

Красивое инженерное подход в контексте жёстких ограничений. Звучит знакомо?

Что в итоге

Пять победителей получат мерч AvitoTech. Подведение итогов — 20 марта.

Но честно: мы запомним не только победителей. Нетривиальное мышление и неожиданный ход — это именно то, за чем мы вообще следим. Немедленный оффер не обещаем. Хотя, как представил наш выезд, из спонтанных идей иногда вырастает кое-что интересное.

→ Попробовать Avito Data Quest

Читают сейчас

Copilot сделает Claude Opus в 27 раз дороже

14 минут назад

Copilot сделает Claude Opus в 27 раз дороже

С 1 июня GitHub переводит Copilot на usage-based оплату. Автодополнения кода остаются без лимитов, всё остальное — чат, агентные режимы, code review — тратит GitHub AI Credits по токенным расценкам. Б

300-400 млн смартфонов в год: OpenAI готовит прямого конкурента iPhone — без приложений и App Store

17 минут назад

300-400 млн смартфонов в год: OpenAI готовит прямого конкурента iPhone — без приложений и App Store

Аналитик TF International Securities Минг-Чи Куо сообщил, что OpenAI разрабатывает собственный смартфон наряду с Qualcomm и MediaTek. Партнеры совместно проектируют процессор, а сборкой займется китай

Банки пожаловались в ФАС на «квазиналог» за маркировку звонков

45 минут назад

Банки пожаловались в ФАС на «квазиналог» за маркировку звонков

Федеральная антимонопольная служба (ФАС) оценит экономическую обоснованность тарифов операторов связи на маркировку звонков. Об этом «Ведомостям» рассказал представитель ведомства. По его словам, эта

Выпуск Steam Controller от Valve состоится 4 мая по цене $100

53 минуты назад

Выпуск Steam Controller от Valve состоится 4 мая по цене $100

Valve назначила дату выхода геймпада Steam Controller на 4 мая 2026 года. Вторая итерация контроллера компании обойдётся в $100. В комплекте с периферийным устройством поставляется магнитная зарядка S

«Яндекс» заявил финансовые результаты за I квартал 2026 года

1 час назад

«Яндекс» заявил финансовые результаты за I квартал 2026 года

28 апреля 2026 года «Яндекс» объявил неаудированные финансовые результаты за начальный квартал 2026 года. Ознакомиться далее