10 мая 2026, 10:47
Cisco выпустила публичный средство «для отслеживания происхождения моделей ИИ»

Компания Cisco выпустила инструмент с открытым исходным кодом для отслеживания происхождения моделей ИИ и сравнения их сходств, что обеспечивает высокую прозрачность цепочки поставок ИИ.
Инструмент Model Provenance Kit представляет собой набор инструментов на языке Python и интерфейс командной строки (CLI), который анализирует такие сигналы, как метаданные и веса, для создания «отпечатка» моделей ИИ. Затем его можно сравнить с отпечатками других моделей, чтобы определить потенциальное общее происхождение.
«Представьте Model Provenance Kit как ДНК-тест для моделей ИИ. Подобно тому, как ДНК-тест выявляет биологическое происхождение, Model Provenance Kit анализирует как метаданные, так и фактические параметры модели, прошедшие обучение (подобно уникальному геному, из которого состоит модель), чтобы оценить, имеют ли модели общее происхождение, и выявить признаки модификации», — отметили исследователи Cisco.

Средство призван устранить пробелы в прозрачности цепочки поставок моделей ИИ. В частности, многие организации используют модели с открытым исходным кодом из таких репозиториев, как HuggingFace, где модели потенциально могут быть загружены с неполной или вводящей в заблуждение документацией.
Инструментарий работает в два этапа и имеет два разных режима: сравнение и сканирование. В режиме сравнения потребитель может выбрать две модели для сравнения и получить разбивку оценок сходства по метрикам, в том числе метаданные, структуру токенизатора и сигналы уровня весов, а также итоговую сводную оценку; если эта итоговая оценка превышает конкретный порог, модели считаются связанными.

В режиме сканирования одна модель может быть сравнена с базой данных известных отпечатков для приблизительно 150 различных базовых моделей из более чем 45 семейств и 20 издателей, включая Meta*, Google, Alibaba, Microsoft, DeepSeek, Nvidia и OpenAI.
На первом этапе анализа инструментарий выполняет «архитектурный скрининг» на основе структурных метаданных и конфигураций моделей, что позволяет быстро определить, имеют ли две модели идентичную архитектуру. Cisco отметила, что только этот этап может решить «значительную часть» задач.
Второй этап включает анализ на уровне весов, рассматривая пять конкретных сигналов: сходство якорных вложений (EAS), распределение норм вложений (END), отпечаток слоя норм (NLF), энергетический профиль слоя (LEP) и косинус значения веса (WVC). Эти сигналы помогают идентифицировать модели, имеющие одинаковый архитектурный шаблон, но обученные отдельно.
Cisco обнаружила, что Model Provenance Kit идентифицировал стандартные производные модели — такие как одна и та же базовая схема с различной тонкой настройкой или выравниванием — в 100% случаев, а равным образом показал 100% полноту для межорганизационных производных, когда модель дорабатывается и выпускается под другим именем иной организацией.
Модели, обученные независимо, но использующие один и тот же токенизатор, были идентифицированы со 100% точностью, и из 111 проанализированных пар моделей только четыре были классифицированы неправильно, что касалось моделей с «экстремальными архитектурными преобразованиями».
В дополнение к защиты организаций от обмана и скрытых рисков, связанных с моделями в экосистеме ИИ с открытым исходным кодом, инструментарий равным образом может помочь избежать проблем с соблюдением нормативных требований, связанных с невозможностью отследить происхождение используемой ими модели.
«Поскольку модели постоянно совершенствуются, перерабатываются, объединяются и переупаковываются, файлы моделей перестали быть статическими активами. Отслеживать происхождение становится сложнее, а скрывать его становится легче, и ответ на вопрос “каково происхождение этой модели?” требует более тонких подходов», — заключили исследователи Cisco.
Читают сейчас

42 минуты назад
Апдейт Terraform в выделенных серверах
Привет, ! Selectel выпустил крупное обновление Terraform. Теперь пользователи могут функционировать с приватными подсетями и применять широкий набор сценариев при настройке конфигураций. Подробнее об

46 минут назад
ИИ-детектор утечек: как работает DLP нового поколения
Сотрудник переименовал файл с клиентской базой в family_photos.xlsx— классический DLP его пропустил. Скопировал текст договора в публичную нейросеть — платформа не отреагировала. Современные сценарии

46 минут назад
Защита на скорости кода: ИИ-триаж и кодфикс в Solar appScreener 3.16 в 10 раз увеличивают емкость команды AppSec
ГК «Солар», ведущий провайдер комплексной кибербезопасности в России, опубликовал крупное обновление комплексной платформы для безопасной разработки ПО Solar appScreener. В новой версии продукта 3.16

51 минуту назад
Как с нуля построить международный облачный размещение за год — на платформе ISPsystem
В противовес большинства кейсов про ISPsystem — где компания приходит к вендору, чтобы заменить устаревшую панель или собрать в одно целое разрозненную инфраструктуру — у NOTBAD HOSTING LTD исходная с

54 минуты назад
Nothing отменила свежий CMF Phone: виной всему – безумные цены на хранилище
Бренд Nothing, популярный своими нестандартными дизайнерскими решениями, заявил об отмене следующего бюджетного смартфона под маркой CMF. Причина – не сбой в расчётах и не проблемы с производством, а