У ИИ-подрядчиков Mercor украли 4 ТБ голосовых сэмплов

3 мин
У ИИ-подрядчиков Mercor украли 4 ТБ голосовых сэмплов

Группа вымогателей группировки Lapsus$ опубликовала на своём сайте утечек данные компании Mercor, которые включают 4 ТБ голосовых образцов от 40 000 подрядчиков, занимающихся разработкой ИИ. 

Утечка содержит биометрические данные голоса в сочетании с удостоверением личности, выданным государством. В соответствии с индексу утёкших образцов, архив охватывает более 40 000 подрядчиков, которые зарегистрировались для разметки данных, записи отрывков для чтения и проведения проверочных звонков для обучения ИИ.

На протяжении десяти дней после публикации было подано пять исков от подрядчиков. Истцы утверждают, что организация собирала голосовые отпечатки под видом «обучающих данных», не уточняя, что они равным образом являются постоянным биометрическим идентификатором. 

Отмечается, что в Mercor при приёме на работу подрядчика запрашивали скан паспорта или водительского удостоверения, затем селфи с веб-камеры, а равным образом запись голоса, читающего заученные фразы в тихой комнате. 

В феврале 2026 года издание Wall Street Journal сообщило, что для высококачественного клонирования голоса теперь требуется примерно 15 секунд чистого эталонного аудио в случае с инструментами, доступными «из коробки». Одновременно записи Mercor в среднем содержат от двух до пяти минут студийной чистой речи на одного подрядчика. 

Полученные информация потенциально позволяют хакерам обходить банковскую верификацию, организовывать вишинг (голосовой фишинг) работодателя жертвы, проводить видеозвонки с использованием технологии дипфейков, а также организовывать иные схемы мошенничества.

Тем, кто мог пострадать от утечки Mercor, рекомендуют:

  • провести автоаудит своего публичного аудиоследа. Поискать на YouTube, в каталогах подкастов и старых записях Zoom образцы своего голоса, которые можно индексировать в открытом доступе;

  • установить кодовое слово для членов семьи и финансовых контактов. Выбрать фразу, которая никогда не произносилась на записи и никогда не набиралась в чате. Проинструктировать людей, которые могут управлять деньгами от имени пользователя;

  • апдейтнуть голосовые информация там где они всё ещё используются, в том числе в Google Voice Match, Amazon Alexa Voice ID, Apple Personal Voice и при любой банковской регистрации;

  • обратиться с просьбой к свой банк отключить скан голоса в качестве фактора проверки, запросить в письменной форме многофакторную аутентификацию, которая сочетает в себе токен приложения или аппаратный ключ;

  • запустить проверку аудиозаписей с помощью криминалистического сканера. Тем, кто получает аудиофайл или голосовое сообщение якобы от знакомого человека, следует проверять его с помощью детектора дипфейков, прежде чем предпринимать какие-либо действия, касающиеся финансов или других важных сфер. 

Ранее в Mercor подтвердили инцидент безопасности, связанный с атакой на цепочку поставок, в которой участвовал инициатива с открытым исходным кодом LiteLLM. В самой Lapsus$ поделились образцом данных, предположительно, от Mercor. В выборку вошли материалы, содержащие ссылки на данные Slack и, по-видимому, информация системы обработки заявок, а равным образом два видео, демонстрирующие разговоры между системами искусственного интеллекта Mercor и подрядчиками на их платформе. 

Читают сейчас

42 минуты назад

Росстандарт утвердил ГОСТ на игрушки с ИИ, вводящий требования к безопасности, данным и взаимодействию с ребёнком

Росстандарт утвердил национальный стандарт ГОСТ Р «Игрушки с применением технологий искусственного интеллекта. Общие требования». Документ начнёт действовать с 1 сентября 2026 года. Стандарт разработа

1 час назад

VK и МФТИ открыли набор на магистерскую программу «Искусственный интеллект и социальные медиа»

Система VK Education и Физтех‑школа прикладной математики и информатики МФТИ запускают магистерскую программу «Искусственный интеллект и социальные медиа». Обучение направлено на подготовку специалист

Подписки Anthropic и OpenAI убыточнее, чем считалось

1 час назад

Подписки Anthropic и OpenAI убыточнее, чем считалось

В январе исследователи уже считали реальную стоимость подписок Claude Code в пересчёте на api. Тогда $200/мес обошлись бы в ~$2 700 по api-расценкам. SemiAnalysis повторили опыт на всех тарифах провай

В MIT написали ОС Fractal, которая «просвечивает» чип — и нашла уязвимость в Apple M1

2 часа назад

В MIT написали ОС Fractal, которая «просвечивает» чип — и нашла уязвимость в Apple M1

Что, если убрать из операционной системы все механизмы защиты — не для атаки, а чтобы наконец увидеть чип без прикрас? Исследователи из MIT сделали ровно это. Их ОС Fractal «просвечивает» процессор на

OpenClaw и LabelStudio: расширяем каталог AI-маркетплейса Selectel

2 часа назад

OpenClaw и LabelStudio: расширяем каталог AI-маркетплейса Selectel

Сборка окружения для обучения моделей забирает слишком множество времени. Развертывание локальных утилит, оркестрация потоков, администрирование прав доступа для асессоров — все это приходится настраи