Anthropic: DeepSeek, Moonshot и MiniMax тайно обучали свои модели на ответах Claude

2 мин
Anthropic: DeepSeek, Moonshot и MiniMax тайно обучали свои модели на ответах Claude

По заявлениям Anthropic, они обнаружили, что три китайские AI-лаборатории — DeepSeek, Moonshot и MiniMax — массово выкачивали ответы Claude, чтобы обучать на них свои модели. Суммарно они сгенерировали больше 16 миллионов запросов через примерно 24 000 поддельных аккаунтов.

Метод называется дистилляция: берёшь сильную модель, скармливаешь ей тысячи промптов, собираешь ответы и используешь их как обучающие информация для своей модели. Сам по себе метод легальный и распространённый, но в данном случае лаборатории нарушали условия использования и обходили региональные ограничения через прокси-сервисы.

Масштабы у всех разные. DeepSeek — 150 000 запросов, причём среди них были задачи, где Claude просили представить и расписать собственную цепочку рассуждений по шагам. Практически так генерируются готовые информация для обучения reasoning-модели. Ещё DeepSeek использовал Claude для создания «безопасных» ответов на политически чувствительные вопросы — видимо, чтобы научить свою схема аккуратно обходить цензурные темы. Moonshot — 3,4 миллиона запросов с фокусом на агентное поведение, работу с инструментами и код. MiniMax — рекордные 13 миллионов, тоже код и инструменты. Когда Anthropic выпустила новую схема, MiniMax за 24 часа перенаправила половину трафика на неё.

Anthropic атрибутировала атаки конкретным лабораториям по IP-адресам, метаданным запросов и инфраструктурным маркерам. В случае DeepSeek удалось отследить аккаунты до конкретных исследователей. У Moonshot метаданные совпали с публичными профилями старших сотрудников.

Доступ шёл через прокси-сервисы, которые перепродают программный интерфейс крупных моделей. Одна такая сеть управляла более чем 20 000 поддельных аккаунтов одновременно, смешивая трафик дистилляции с обычными клиентскими запросами.

Anthropic подчёркивает, что дистиллированные модели теряют защитные механизмы — фильтры на разработка биооружия, вредоносного кода и так далее. А ещё что такие атаки подрывают смысл экспортного контроля: со стороны кажется, что китайские лаборатории быстро развиваются сами, хотя на деле часть возможностей просто извлечена из американских моделей.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся фактическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Читают сейчас

Вышло апдейт RapidRAW 1.5.6 — открытого редактора изображений RAW

22 минуты назад

Вышло апдейт RapidRAW 1.5.6 — открытого редактора изображений RAW

В начале июня 2026 года состоялся выпуск обновления открытого мультиплатформенного редактора изображений RapidRAW 1.5.6 с улучшенным экспериментальным релизом для планшетов на Android. Проект предлага

Выпуск BATorrent 3.0 — легковесного BitTorrent-клиента, созданного на C++, Qt 6 и libtorrent-rasterbar

4 часа назад

Выпуск BATorrent 3.0 — легковесного BitTorrent-клиента, созданного на C++, Qt 6 и libtorrent-rasterbar

В начале июня 2026 года состоялся третий мажорный выпуск открытого проекта BATorrent — легковесного BitTorrent‑клиента, созданного на C++, Qt 6 и libtorrent‑rasterbar. Версия BATorrent 1.0 состоялся в

4 часа назад

MAX удалили из App Store

Мессенджер MAX пропал из App Store. Просто в один момент В среду, 3 июня, кто-то из пользователей iOS заметил странное: отечественный мессенджер "Макс" не ищется в App Store. Вообще. Ни через поиск, н

Версия обновления открытого проекта RustDesk 1.4.7

4 часа назад

Версия обновления открытого проекта RustDesk 1.4.7

В начале июня 2026 года состоялся версия открытого мультиплатформеного проекта RustDesk 1.4.7. Это приложение для удалённого рабочего стола, разработанное для самохостинга в качестве альтернативы Team

️ Anthropic разобрала 832 аккаунта, заблокированных за вредоносную активность с марта 2025 по март 2026 года

4 часа назад

️ Anthropic разобрала 832 аккаунта, заблокированных за вредоносную активность с марта 2025 по март 2026 года

⚡️ Anthropic разобрала 832 аккаунта, заблокированных за вредоносную активность с марта 2025 по март 2026 года. ИИ всё чаще используют не для банального фишинга, а для сложных этапов атаки уже внутри в