Контроль вместо экспериментов: собрали платформу для управления LLM в бизнесе

2 мин
Контроль вместо экспериментов: собрали платформу для управления LLM в бизнесе

Мы запустили red_mad_router — платформу для компаний, у которых LLM уже работают в продуктах, внутренних ассистентах и клиентских сервисах. Она помогает подключать разные модели в одном контуре, управлять доступами, контролировать расходы и задавать правила безопасности для локальных и облачных LLM.

Зачем всё это?

Когда модели используются в нескольких сервисах, вокруг них быстро появляется инфраструктурная обвязка: ключи, лимиты, провайдеры, маршруты запросов, требования к данным, отчёты по потреблению. Если настраивать всё это по отдельности для каждого сценария, поддерживать единые правила становится сложнее.

В red_mad_router мы собираем всё это в одном контуре:

  • подключение новых моделей и провайдеров через совместимый со стандартом OpenAI api за 17 строк кода;

  • управление доступами для команд и сотрудников;

  • лимиты и квоты на уровне команд и отдельных ключей;

  • мониторинг потребления токенов и распределения нагрузки по моделям;

  • политики безопасности для локальных и облачных LLM.

Общий контур подключения

Платформа разворачивается в корпоративном контуре и подключается к существующей инфраструктуре, следовательно правила работы с моделями и чувствительными данными не выносятся в разрозненные внешние инструменты.

Единый программный оболочку поддерживает работу с облачными LLM-провайдерами и open source-моделями, развёрнутыми локально. Для команд это выглядит как единая точка доступа: модели можно подключать, менять и комбинировать без отдельной логики под каждого провайдера.

Доступы и правила для команд

Ключи, роли и ограничения настраиваются централизованно. Можно задавать разные правила для команд и отдельных ключей:

  • кому какие модели доступны;

  • какие лимиты действуют;

  • какие требования применяются к данным.

Например, разработке можно открыть широкий набор моделей для тестирования, а продуктовому контуру оставить только согласованный стек и заданные бюджетные лимиты.

Контроль данных и безопасности

За безопасность в продукте отвечает наш собственный модуль Guardrails. Он фильтрует персональные данные до отправки запроса в модель, ограничивает нежелательные ответы и позволяет задавать разные политики для LLM.

Дополнительно предусмотрены логирование запросов и действий пользователей, а равным образом разграничение прав доступа.

Устойчивая работа под нагрузкой

Для рабочих сценариев добавили механизм fallback. Если одна модель не отвечает, запрос автоматически уходит в резервную.

Алгоритм нужен для балансировки нагрузки: можно заранее задать несколько LLM и распределять между ними запросы с учётом доступности и ресурсов.

Прозрачное потребление

В red_mad_router видно, какие команды, ключи и модели создают основную нагрузку. Можно отслеживать потребление токенов, задавать лимиты и квоты, просматривать распределение расходов и настраивать алерты.

Мы собрали red_mad_router для команд, у которых LLM уже встроены в продукты и внутренние сервисы. Когда управление моделями остаётся разрозненным, растут затраты на администрирование, сложнее контролировать расходы и выше риск некорректной работы с корпоративными данными.

Читают сейчас

24 минуты назад

FCC добавила портативные импортные хотспоты в список запрещённого к ввозу оборудования

Федеральная комиссия по связи США уточнила, что запрет на потребительские роутеры иностранного производства распространяется равным образом на портативные точки доступа. Смартфоны с функцией раздачи и

Исследование: хакеры перехватили сотни поддоменов американских вузов и опубликовали на них порно и спам

46 минут назад

Исследование: хакеры перехватили сотни поддоменов американских вузов и опубликовали на них порно и спам

Исследователь Алекс Шахов из SH Consulting обнаружил, злоумышленники перехватили сотни поддоменов крупнейших университетов США, в том числе Колумбийский, Стэнфордский, Гарвардский, Вашингтонский и Кал

Депутат Госдумы предлагает ограничить покупку лутбоксов для несовершеннолетних в EA Sports FC и Counter-Strike 2

55 минут назад

Депутат Госдумы предлагает ограничить покупку лутбоксов для несовершеннолетних в EA Sports FC и Counter-Strike 2

Депутат Госдумы РФ Виталий Милонов направил обращение в Роскомнадзор с предложением рассмотреть ограничения на внутриигровые покупки для несовершеннолетних. Об этом сообщает издание «Mash на спорте».

Commodore представила настольный компьютер Commodore C64C Ultimate

1 час назад

Commodore представила настольный компьютер Commodore C64C Ultimate

В Commodore представили настольный компьютер Commodore C64C Ultimate. Новинка получила корпус, похожий на модель 1986 года, но тоньше и с современной цветовой схемой. Организация также приобрела ориги

Эксперты RKS Global: из 30 популярных российских Android-приложений теперь все детектируют VPN

1 час назад

Эксперты RKS Global: из 30 популярных российских Android-приложений теперь все детектируют VPN

Эксперты RKS Global повторно протестировали 30 популярных российских Android‑приложений и выяснили, что теперь все из них детектируют VPN, а часть проектов, в соответствии с сетевым логам, отправляют