AI-диджей Spotify иногда не понимает даже простые музыкальные запросы

2 мин
AI-диджей Spotify иногда не понимает даже простые музыкальные запросы

AI-диджей Spotify задумывался как умный помощник, который подбирает музыку и реагирует на голосовые команды пользователя. Но один из пользователей решил проверить, насколько хорошо платформа понимает классическую музыку — и эксперимент закончился неудачей.

Проблема начинается с того, что большинство цифровых музыкальных сервисов изначально проектировались под поп-музыку. Метаданные треков обычно строятся вокруг трёх полей: исполнитель, альбом и песня. Для современной популярной музыки этого достаточно, но для классической традиции — нет.

Классические произведения часто состоят из нескольких частей. В частности, Седьмая симфония Бетховена включает четыре последовательных движения, которые обычно исполняются в строгом порядке. Тем не менее в Spotify такие произведения часто разбиваются на отдельные треки без чёткой связи между ними.

Пользователь решил проверить, сможет ли AI-диджей справиться с несложный задачей.

Команда была максимально прямой: «Включи Седьмую симфонию Бетховена». AI ответил, что поставит именно её, но вместо первой части включил вторую — знаменитое Allegretto. После этого алгоритм вообще переключился на другую музыку: сначала на интермеццо из оперы Масканьи, затем на произведение Шостаковича, а потом на фрагмент из «Реквиема» Моцарта.

Другие новости и материалы по AI — в Telegram-канале NH | Новости технологий, AI и будущее.

Попытка уточнить запрос тоже не помогла. Когда потребитель попросил «включить Седьмую симфонию Бетховена целиком», AI-диджей объявил, что сейчас прозвучит вся симфония… и снова поставил только вторую часть.

Даже более точные команды вроде «включи все четыре части симфонии по порядку» не дали ожидаемого результата. Система начала с первой части, затем поставила вторую — но уже из другой записи с другим оркестром, после чего перескочила сразу к четвёртой и только потом к третьей.

Выглядело это около так, как если бы аудиокнига начала воспроизводить последнюю главу перед предпоследней.

Задача, по мнению автора эксперимента, не в сложности задачи. Информация о структуре произведения легко доступна — например, даже в Википедии прямо указано, что Седьмая симфония Бетховена состоит из четырёх частей. Тем не менее механизм Spotify, похоже, просто не учитывает эту структуру.

В итоге эксперимент закончился тем, что AI-диджей неожиданно «сменил настроение» и стартовал играть рок-классику — Aerosmith, Beatles и Pink Floyd.

Этот пример показывает, что даже современные AI-системы могут испытывать трудности с задачами, которые для человека выглядят вполне очевидными — в частности, воспроизвести музыкальное произведение полностью и в правильном порядке.

Конечно, Spotify DJ пока находится в стадии бета-тестирования, и многие проблемы могут быть исправлены. Но этот случай показывает, насколько сильно «интеллект» подобных систем зависит от структуры данных и того, как именно обучены алгоритмы.

Читают сейчас

«AGI будет выглядеть как разминка»: Альтман о следующем прорыве в ИИ

54 минуты назад

«AGI будет выглядеть как разминка»: Альтман о следующем прорыве в ИИ

Глава OpenAI Сэм Альтман объявил, что в ближайшем будущем может произойти архитектурный прорыв за пределами трансформеров — и что нынешние модели уже в достаточной степени умны, чтобы помочь его найти

3 часа назад

Весенний апгрейд отменяется: почему видеокарты снова дорожают и при чём здесь не только Ближний Восток

Если верить заголовкам, у подорожания видеокарт есть один простой виновник: новый виток войны на Ближнем Востоке. Но реальность, как это обычно бывает с железом, неприятнее и многослойнее. По состояни

Почему конференции мертвы и зачем мы делаем свою. Часть II

5 часов назад

Почему конференции мертвы и зачем мы делаем свою. Часть II

В прошлый раз говорили про технику и доклады, сегодня поговорим про экономику. Для начала напомню контекст: после нескольких митапов и треков на других конференциях я решил сделать свою. Вот она, свеж

ByteDance отложила глобальный запускание AI-модели генерации видео Seedance 2.0 из-за споров об авторском праве

5 часов назад

ByteDance отложила глобальный запускание AI-модели генерации видео Seedance 2.0 из-за споров об авторском праве

Китайская технологическая организация ByteDance, известная как владелец платформы TikTok, приостановила глобальный запускание своей новой модели генерации видео Seedance 2.0 после серии конфликтов с г

Программисты в красной зоне: Карпати вычислил, каким профессиям угрожает ИИ

6 часов назад

Программисты в красной зоне: Карпати вычислил, каким профессиям угрожает ИИ

Андрей Карпати, бывший директор по ИИ в Tesla и один из основателей OpenAI, выложил проект, в котором оценил уязвимость перед ИИ всех 342 профессий американской экономики. Каждая получила балл от 0 до