Cisco выпустила публичный средство «для отслеживания происхождения моделей ИИ»

3 мин
Cisco выпустила публичный средство «для отслеживания происхождения моделей ИИ»

Компания Cisco выпустила инструмент с открытым исходным кодом для отслеживания происхождения моделей ИИ и сравнения их сходств, что обеспечивает высокую прозрачность цепочки поставок ИИ.

Инструмент Model Provenance Kit представляет собой набор инструментов на языке Python и интерфейс командной строки (CLI), который анализирует такие сигналы, как метаданные и веса, для создания «отпечатка» моделей ИИ. Затем его можно сравнить с отпечатками других моделей, чтобы определить потенциальное общее происхождение.

«Представьте Model Provenance Kit как ДНК-тест для моделей ИИ. Подобно тому, как ДНК-тест выявляет биологическое происхождение, Model Provenance Kit анализирует как метаданные, так и фактические параметры модели, прошедшие обучение (подобно уникальному геному, из которого состоит модель), чтобы оценить, имеют ли модели общее происхождение, и выявить признаки модификации», — отметили исследователи Cisco. 

Средство призван устранить пробелы в прозрачности цепочки поставок моделей ИИ. В частности, многие организации используют модели с открытым исходным кодом из таких репозиториев, как HuggingFace, где модели потенциально могут быть загружены с неполной или вводящей в заблуждение документацией.

Инструментарий работает в два этапа и имеет два разных режима: сравнение и сканирование. В режиме сравнения потребитель может выбрать две модели для сравнения и получить разбивку оценок сходства по метрикам, в том числе метаданные, структуру токенизатора и сигналы уровня весов, а также итоговую сводную оценку; если эта итоговая оценка превышает конкретный порог, модели считаются связанными.

В режиме сканирования одна модель может быть сравнена с базой данных известных отпечатков для приблизительно 150 различных базовых моделей из более чем 45 семейств и 20 издателей, включая Meta*, Google, Alibaba, Microsoft, DeepSeek, Nvidia и OpenAI.

На первом этапе анализа инструментарий выполняет «архитектурный скрининг» на основе структурных метаданных и конфигураций моделей, что позволяет быстро определить, имеют ли две модели идентичную архитектуру. Cisco отметила, что только этот этап может решить «значительную часть» задач.

Второй этап включает анализ на уровне весов, рассматривая пять конкретных сигналов: сходство якорных вложений (EAS), распределение норм вложений (END), отпечаток слоя норм (NLF), энергетический профиль слоя (LEP) и косинус значения веса (WVC). Эти сигналы помогают идентифицировать модели, имеющие одинаковый архитектурный шаблон, но обученные отдельно.

Cisco обнаружила, что Model Provenance Kit идентифицировал стандартные производные модели — такие как одна и та же базовая схема с различной тонкой настройкой или выравниванием — в 100% случаев, а равным образом показал 100% полноту для межорганизационных производных, когда модель дорабатывается и выпускается под другим именем иной организацией.

Модели, обученные независимо, но использующие один и тот же токенизатор, были идентифицированы со 100% точностью, и из 111 проанализированных пар моделей только четыре были классифицированы неправильно, что касалось моделей с «экстремальными архитектурными преобразованиями».

В дополнение к защиты организаций от обмана и скрытых рисков, связанных с моделями в экосистеме ИИ с открытым исходным кодом, инструментарий равным образом может помочь избежать проблем с соблюдением нормативных требований, связанных с невозможностью отследить происхождение используемой ими модели.

«Поскольку модели постоянно совершенствуются, перерабатываются, объединяются и переупаковываются, файлы моделей перестали быть статическими активами. Отслеживать происхождение становится сложнее, а скрывать его становится легче, и ответ на вопрос “каково происхождение этой модели?” требует более тонких подходов», — заключили исследователи Cisco.

Читают сейчас

В Италии впервые диагностировали зависимость от ИИ

45 минут назад

В Италии впервые диагностировали зависимость от ИИ

Итальянская национальная служба поддержки людей с зависимостями (Servizio per le Dipendenze, SerD) в начальный раз в стране зафиксировала аддикцию от искусственного интеллекта, пишет местное книга Gaz

52 минуты назад

Instagram* отключил сквозное шифрование личных сообщений: что произошло 8 мая 2026 года

С 8 мая 2026 года Instagram* официально перестал поддерживать сквозное шифрование (E2EE) в директах. Meta** теперь технически способна видеть содержимое переписок между пользователями платформы. Офици

В США чиновники резали гранты через ChatGPT. Потом сделали бота крайним в суде

1 час назад

В США чиновники резали гранты через ChatGPT. Потом сделали бота крайним в суде

Окружной судья Колин Маккэхон в Манхэттене 7 мая признала незаконной отмену больше 1400 грантов Национального фонда гуманитарных наук — государственной структуры, которая распределяет деньги между уче

В Ploopy перенесли TrackPoint от ноутбуков ThinkPad в портативную манипулятор

2 часа назад

В Ploopy перенесли TrackPoint от ноутбуков ThinkPad в портативную манипулятор

Организация Ploopy анонсировала альтернативу мыши с открытым исходным кодом, которая обходится без тачпадов и трекболов. Ploopy Bean получила джойстик, похожий на TrackPoint, который IBM устанавливала

В Teams добавили меры защиты против имитирующих бренды звонков

2 часа назад

В Teams добавили меры защиты против имитирующих бренды звонков

Microsoft внедрит в Teams защиту от подделки брендов для звонков. Пользователей будут предупреждать о подозрительных входящих звонках. Microsoft надеется таким образом снизить уровень мошенничества с