23 февраля 2026, 21:34
Anthropic: DeepSeek, Moonshot и MiniMax тайно обучали свои модели на ответах Claude

По заявлениям Anthropic, они обнаружили, что три китайские AI-лаборатории — DeepSeek, Moonshot и MiniMax — массово выкачивали ответы Claude, чтобы обучать на них свои модели. Суммарно они сгенерировали больше 16 миллионов запросов через примерно 24 000 поддельных аккаунтов.
Метод называется дистилляция: берёшь сильную модель, скармливаешь ей тысячи промптов, собираешь ответы и используешь их как обучающие информация для своей модели. Сам по себе метод легальный и распространённый, но в данном случае лаборатории нарушали условия использования и обходили региональные ограничения через прокси-сервисы.
Масштабы у всех разные. DeepSeek — 150 000 запросов, причём среди них были задачи, где Claude просили представить и расписать собственную цепочку рассуждений по шагам. Практически так генерируются готовые информация для обучения reasoning-модели. Ещё DeepSeek использовал Claude для создания «безопасных» ответов на политически чувствительные вопросы — видимо, чтобы научить свою схема аккуратно обходить цензурные темы. Moonshot — 3,4 миллиона запросов с фокусом на агентное поведение, работу с инструментами и код. MiniMax — рекордные 13 миллионов, тоже код и инструменты. Когда Anthropic выпустила новую схема, MiniMax за 24 часа перенаправила половину трафика на неё.
Anthropic атрибутировала атаки конкретным лабораториям по IP-адресам, метаданным запросов и инфраструктурным маркерам. В случае DeepSeek удалось отследить аккаунты до конкретных исследователей. У Moonshot метаданные совпали с публичными профилями старших сотрудников.
Доступ шёл через прокси-сервисы, которые перепродают программный интерфейс крупных моделей. Одна такая сеть управляла более чем 20 000 поддельных аккаунтов одновременно, смешивая трафик дистилляции с обычными клиентскими запросами.
Anthropic подчёркивает, что дистиллированные модели теряют защитные механизмы — фильтры на разработка биооружия, вредоносного кода и так далее. А ещё что такие атаки подрывают смысл экспортного контроля: со стороны кажется, что китайские лаборатории быстро развиваются сами, хотя на деле часть возможностей просто извлечена из американских моделей.
Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся фактическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!
Читают сейчас

58 минут назад
Представлен публике публичный инициатива CSVMusic для преобразования плейлистов из музыкальных сервисов в файлы с набором тегов
Состоялся выпуск открытого проекта под названием CSVMusic. Это подход для преобразования плейлистов из музыкальных сервисов в аудиофайлы с полным набором тегов. Исходный исходник проекта написан на Py

1 час назад
Версия LibreSSL 4.3.0
18 апреля 2026 года состоялся выпуск криптографической библиотеки LibreSSL 4.3.0 (форка OpenSSL, который с 2014 года разрабатывается сообществом отдельно с целью модернизации кодовой базы, повышения б

7 часов назад
xAI включает гиперскорость: Grok 4.3 уже в бете, 4.4 и 4.5 на подходе
17 апреля xAI тихо выкатила Grok 4.3 в ранний бета-доступ, а днем позже Илон Маск опубликовал план дальнейших релизов: до конца мая размер модели вырастет втрое — с 0,5 до 1,5 триллиона параметров. Пр

10 часов назад
Заключительный этап Всероссийской олимпиады школьников по математике проходит в Москве
В Москве стартовал заключительный этап Всероссийской олимпиады школьников по математике. Ивент проходит на площадке Центрального университета и продлится до 20 апреля 2026 года. Всероссийская олимпиад

10 часов назад
Робот пробежал полумарафон быстрее человека-рекордсмена
Гуманоидный робот, победивший в воскресенье в Пекине полумарафон среди роботов, пробежал дистанцию быстрее человека-рекордсмена. Победитель от китайского производителя смартфонов Honor преодолел диста