27 апреля 2026, 15:37

У ИИ-подрядчиков Mercor украли 4 ТБ голосовых сэмплов

3 мин

Группа вымогателей группировки Lapsus$ опубликовала на своём сайте утечек данные компании Mercor, которые включают 4 ТБ голосовых образцов от 40 000 подрядчиков, занимающихся разработкой ИИ.

Утечка содержит биометрические данные голоса в сочетании с удостоверением личности, выданным государством. В соответствии с индексу утёкших образцов, архив охватывает более 40 000 подрядчиков, которые зарегистрировались для разметки данных, записи отрывков для чтения и проведения проверочных звонков для обучения ИИ.

На протяжении десяти дней после публикации было подано пять исков от подрядчиков. Истцы утверждают, что организация собирала голосовые отпечатки под видом «обучающих данных», не уточняя, что они равным образом являются постоянным биометрическим идентификатором.

Отмечается, что в Mercor при приёме на работу подрядчика запрашивали скан паспорта или водительского удостоверения, затем селфи с веб-камеры, а равным образом запись голоса, читающего заученные фразы в тихой комнате.

В феврале 2026 года издание Wall Street Journal сообщило, что для высококачественного клонирования голоса теперь требуется примерно 15 секунд чистого эталонного аудио в случае с инструментами, доступными «из коробки». Одновременно записи Mercor в среднем содержат от двух до пяти минут студийной чистой речи на одного подрядчика.

Полученные информация потенциально позволяют хакерам обходить банковскую верификацию, организовывать вишинг (голосовой фишинг) работодателя жертвы, проводить видеозвонки с использованием технологии дипфейков, а также организовывать иные схемы мошенничества.

Тем, кто мог пострадать от утечки Mercor, рекомендуют:

провести автоаудит своего публичного аудиоследа. Поискать на YouTube, в каталогах подкастов и старых записях Zoom образцы своего голоса, которые можно индексировать в открытом доступе;
установить кодовое слово для членов семьи и финансовых контактов. Выбрать фразу, которая никогда не произносилась на записи и никогда не набиралась в чате. Проинструктировать людей, которые могут управлять деньгами от имени пользователя;
апдейтнуть голосовые информация там где они всё ещё используются, в том числе в Google Voice Match, Amazon Alexa Voice ID, Apple Personal Voice и при любой банковской регистрации;
обратиться с просьбой к свой банк отключить скан голоса в качестве фактора проверки, запросить в письменной форме многофакторную аутентификацию, которая сочетает в себе токен приложения или аппаратный ключ;
запустить проверку аудиозаписей с помощью криминалистического сканера. Тем, кто получает аудиофайл или голосовое сообщение якобы от знакомого человека, следует проверять его с помощью детектора дипфейков, прежде чем предпринимать какие-либо действия, касающиеся финансов или других важных сфер.

Ранее в Mercor подтвердили инцидент безопасности, связанный с атакой на цепочку поставок, в которой участвовал инициатива с открытым исходным кодом LiteLLM. В самой Lapsus$ поделились образцом данных, предположительно, от Mercor. В выборку вошли материалы, содержащие ссылки на данные Slack и, по-видимому, информация системы обработки заявок, а равным образом два видео, демонстрирующие разговоры между системами искусственного интеллекта Mercor и подрядчиками на их платформе.

mercor lapsu$голосовые данные машинное обучение утечка данных сэмплы дипфейки вишинг кибербезопасность

Читают сейчас

8 часов назад

Nvidia подняла цены на свои видеокарты — подорожание затронуло весь современный модельный ряд с GDDR7 и GDDR6

Nvidia уведомила своих партнёров о повышении цен на видеокарты, подорожание затронуло весь современный модельный ряд с GDDR7 и GDDR6. Рост стоимости последовало за корректировкой цен на GeForce RTX 50

8 часов назад

Новые подробности взлома Hugging Face агентом OpenAI: организация могла не замечать проблему почти неделю

История с автономным ИИ-агентом OpenAI, который во время внутреннего тестирования вышел за пределы изолированной среды и атаковал инфраструктуру Hugging Face, получила новые подробности. Reuters восст

9 часов назад

Qualcomm предупредила клиентов о предстоящем повышении цен на чипы для смартфонов, ноутбуков и других устройств

Qualcomm предупредила клиентов о грядущем подорожании чипов для смартфонов, ноутбуков и других устройств на «двузначное число процентов», пишет Bloomberg. Новые цены начнут действовать для продукции,

9 часов назад

Tesla собирается «открыть исходный исходник» Model S и X

Илон Маск заявил, что Tesla планирует «открыть исходный исходник» Model S и Model X, и в качестве образца использует оригинальный Roadster. Читать далее

9 часов назад

Amazon ужесточит контроль за генерацией продавцами изображений товаров

Amazon потребовала от сторонних продавцов помечать любые изображения или видео товаров, содержащие «сгенерированных ИИ людей». Политика предписывает продавцам помечать изображения и любой «контент A+»