1 час назад
Изображение оказалось способно взломать модели ИИ с визуальным и языковым анализом

Исследователи из Флоридского международного университета выяснили, что одного изображения может быть в достаточной степени, чтобы вывести некоторые системы ИИ за пределы их встроенных средств защиты.
Они изучили, как тонкие изменения изображений могут быть использованы для манипулирования моделями ИИ. При этом для человеческого глаза такие картинки выглядят нормально. Однако для системы ИИ эти крошечные изменения на уровне пикселей могут резко изменить то, как они интерпретируются.
Команда разработала способ под названием JaiLIP (Jailbreaking with Loss-guided Image Perturbation, взлом с помощью искажения изображения, управляемого потерями). Метод вносит тщательно рассчитанные изменения в изображение, сохраняя одновременно его внешний вид для глаза. Цель состоит в том, чтобы повлиять на то, как модель обработки изображений и языка реагирует на запросы пользователя.
Это различие важно, потому что системы ИИ видят изображения не так, как люди. В то время как мы распознаём объекты, цвета и сцены, ИИ обрабатывает математические представления пикселей и узоров.
В процессе тестирования с BLIP-2, мультимодальной моделью ИИ, используемой исследователями и разработчиками, команда обнаружила, что изображения JaiLIP значительно повышают вероятность небезопасных ответов. По словам исследователей, этот метод превзошёл предыдущие и почти вдвое расширил количество вредоносных результатов, сгенерированных во время тестирования.
В качестве примера команда привела модифицированное изображение светофора. Хотя изображение казалось обычным для человека, оно, как сообщается, повлияло на модель, заставив её дать инструкции по проезду на красный свет, чтобы избежать штрафа за нарушение правил дорожного движения — информацию, которую система обычно отказывается предоставлять.
Особый интерес к этому исследованию вызывает то, что оно выявляет новую уязвимую поверхность. По ходу того, как компании внедряют агентов обслуживания клиентов на основе ИИ, автоматизированные рабочие процессы и мультимодальные системы, принимающие как текстовые, так и графические данные, злоумышленникам может больше не понадобиться полагаться исключительно на подсказки для манипулирования поведением модели.
Результаты особенно актуальны для небольших организаций, которые могут применять модели ИИ с открытым исходным кодом или развёртывать инструменты без тщательного тестирования безопасности. Изменённое изображение, загруженное через чат-бот, сайт поддержки или автоматизированный рабочий процедура, потенциально может повлиять на то, как платформа ИИ реагирует в фоновом режиме.
Исследование равным образом служит напоминанием о том, что модели ИИ по-прежнему воспринимают мир совсем иначе.
Читают сейчас

1 час назад
SpaceX при тесте миссии возвращаемой капсулы Starfall запустила в космос пивные и винные дрожжи
Организация Starbase Brewing отчиталась о возвращении на Землю капсулы Starfall от SpaceX, которая содержала десятки различных штаммов пивных, спиртовых и винных дрожжей со всего мира. Равным образом

1 час назад
На ИИ-лазер против комаров собрали $2,7 млн — производство начнут в августе
Китайский стартап-компания Photon Matrix Lab из Чанчжоу (провинция Цзянсу) собрал $2,7 млн на платформе Indiegogo на девайс, которое находит комаров в воздухе и сбивает их лазером. Деньги внесли прибл
1 час назад
Ubisoft Barcelona уволит приблизительно 28% штата
Сотрудники Ubisoft Barcelona объявили о забастовке после сообщения об увольнении 51 человека. Это примерно 28% сотрудников студии. Читать далее

1 час назад
Опция «Ваш механизм» в Instagram** получит новые способы настройки
Глава Instagram** Адам Моссери представил новые способы настройки функции «Ваш алгоритм», которая позволяет пользователям указывать, какие темы они хотят видеть чаще или реже. Компания оценивает неско

2 часа назад
Версия обновления видеоредактора с открытым исходным кодом Shotcut 26.6
27 июня 2026 года состоялся выпуск мультиплатформенного видеоредактора с открытым исходным кодом Shotcut 26.6, созданного на основе MLT Multimedia Framework. Исходный код проекта написан на C++ и QML