1 час назад
Microsoft опенсорснула RAMPART — каркас безопасности ИИ-агентов

Microsoft выложила в публичный доступ два инструмента для разработчиков ИИ-агентов — RAMPART и Clarity. Первый встраивает тестирование безопасности прямо в CI-пайплайн, следующий помогает продумать архитектуру до написания кода. Оба проекта доступны на GitHub.
RAMPART — это каркас для написания тестов безопасности в формате обычных pytest-сценариев. Он построен поверх PyRIT, открытой платформы Microsoft для проверки генеративных моделей. Логика простая: разработчик описывает скрипт угрозы из своей модели рисков, каркас подключается к агенту, прогоняет взаимодействие и выдает результат — пройдено или нет. Тесты встают в CI рядом с обычными интеграционными и блокируют сборку при провале. Внедрил агенту новый инструмент или источник данных — добавь проверка на безопасность в том же пулл-реквесте.
Главный фокус RAMPART сейчас — атаки через добавление промптов (prompt injection), когда агент получает вредоносные инструкции не от пользователя, а из обрабатываемых данных: писем, тикетов, документов. Каркас умеет работать с вероятностной природой языковых моделей: один и тот же проверка можно прогнать некоторое количество раз и задать порог — например, "действие должно быть безопасным минимум в 80% запусков". Это ближе к реальному поведению агентов в продакшене, чем разовая тест.
Clarity устроен иначе — это не про тестирование, а про проектирование. Средство работает как собеседник, который задает вопросы, которые обычно задают опытные архитекторы и специалисты по безопасности. В частности, команда хочет добавить совместное редактирование в документ — Clarity спросит, что произойдет, если два человека одновременно редактируют один абзац. Результаты сохраняются в директории .clarity-protocol/ внутри репозитория как обычный markdown — их можно коммитить, ревьюить и диффить вместе с кодом. Несколько ИИ-"аналитиков" независимо проверяют систему с разных сторон: защита, человеческий фактор, операционные риски.
Microsoft позиционирует оба инструмента как часть подхода, в котором защита ИИ — это не разовый аудит, а непрерывная инженерная дисциплина. Clarity фиксирует решения и допущения на старте, RAMPART превращает результаты ред-тиминга и инциденты в регрессионные тесты, которые живут столько же, сколько сам инициатива.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

1 час назад
Cursor Composer 2.5 вошел в топ-3 ИИ для кодинга
Сервис независимых оценок ИИ-моделей Artificial Analysis опубликовал свежий сводный рейтинг агентов для программирования — Coding Agent Index. В нем Cursor Composer 2.5 набрал 63 балла и занял третье

1 час назад
Прототипы космических детекторов нейтрино отправляются на орбиту
Нейтрино, вторые по распространённости фундаментальные частицы во Вселенной, известны тем, что их крайне сложно обнаружить. До сих пор это удавалось сделать только путём создания гигантских резервуаро
1 час назад
Фонд Викимедиа увольняет инженеров, отвечающих за работу с пожеланиями пользователей
20 мая Сай Суман Черукувада, заместитель директора Фонда Викимедиа (организации, поддерживающей инфраструктуру Википедии) по продуктам и технологиям, заявил о роспуске команды, отвечающей за работу с
3 часа назад
В США создали спецподразделение для внедрения ИИ в военные операции
Киберкомандование США сформировало специальное подразделение для изучения и освоения ИИ‑инструментов с продвинутыми хакерскими возможностями, говорит Politico со ссылкой на источники. Читать далее

3 часа назад
Apple отчиталась о работе службы безопасности магазина приложений App Store в 2025 году
Apple опубликовала отчёт о работе службы безопасности магазина приложений App Store — организация поделилась показателями за 2025 год. Ознакомиться далее