30 апреля 2026, 17:41

Контроль вместо экспериментов: собрали платформу для управления LLM в бизнесе

2 мин

Мы запустили red_mad_router — платформу для компаний, у которых LLM уже работают в продуктах, внутренних ассистентах и клиентских сервисах. Она помогает подключать разные модели в одном контуре, управлять доступами, контролировать расходы и задавать правила безопасности для локальных и облачных LLM.

Зачем всё это?

Когда модели используются в нескольких сервисах, вокруг них быстро появляется инфраструктурная обвязка: ключи, лимиты, провайдеры, маршруты запросов, требования к данным, отчёты по потреблению. Если настраивать всё это по отдельности для каждого сценария, поддерживать единые правила становится сложнее.

В red_mad_router мы собираем всё это в одном контуре:

подключение новых моделей и провайдеров через совместимый со стандартом OpenAI api за 17 строк кода;
управление доступами для команд и сотрудников;
лимиты и квоты на уровне команд и отдельных ключей;
мониторинг потребления токенов и распределения нагрузки по моделям;
политики безопасности для локальных и облачных LLM.

Общий контур подключения

Платформа разворачивается в корпоративном контуре и подключается к существующей инфраструктуре, следовательно правила работы с моделями и чувствительными данными не выносятся в разрозненные внешние инструменты.

Единый программный оболочку поддерживает работу с облачными LLM-провайдерами и open source-моделями, развёрнутыми локально. Для команд это выглядит как единая точка доступа: модели можно подключать, менять и комбинировать без отдельной логики под каждого провайдера.

Доступы и правила для команд

Ключи, роли и ограничения настраиваются централизованно. Можно задавать разные правила для команд и отдельных ключей:

кому какие модели доступны;
какие лимиты действуют;
какие требования применяются к данным.

Например, разработке можно открыть широкий набор моделей для тестирования, а продуктовому контуру оставить только согласованный стек и заданные бюджетные лимиты.

Контроль данных и безопасности

За безопасность в продукте отвечает наш собственный модуль Guardrails. Он фильтрует персональные данные до отправки запроса в модель, ограничивает нежелательные ответы и позволяет задавать разные политики для LLM.

Дополнительно предусмотрены логирование запросов и действий пользователей, а равным образом разграничение прав доступа.

Устойчивая работа под нагрузкой

Для рабочих сценариев добавили механизм fallback. Если одна модель не отвечает, запрос автоматически уходит в резервную.

Алгоритм нужен для балансировки нагрузки: можно заранее задать несколько LLM и распределять между ними запросы с учётом доступности и ресурсов.

Прозрачное потребление

В red_mad_router видно, какие команды, ключи и модели создают основную нагрузку. Можно отслеживать потребление токенов, задавать лимиты и квоты, просматривать распределение расходов и настраивать алерты.

Мы собрали red_mad_router для команд, у которых LLM уже встроены в продукты и внутренние сервисы. Когда управление моделями остаётся разрозненным, растут затраты на администрирование, сложнее контролировать расходы и выше риск некорректной работы с корпоративными данными.

ai open api llm router open source

Читают сейчас

10 часов назад

Почта, чаты, звонки, файлы: сколько для компании стоит виртуальный зоопарк

Когда рабочие коммуникации распределены между пятью–семью сервисами, бизнес платит не только за лицензии. Растут затраты на администрирование, управление доступами и интеграции, а сотрудники тратят вр

11 часов назад

Назад в Арктику: обеспечим связь для возвращаемой стратосферной платформы в контексте арктической экспедиции «Росатома»

Помните наш стратосферный прыжок и запускание сервера на льдине в Арктике? А мы не просто помним, а решили, что пора вернуться. Потому официально объявляем, что RUVDS выступит технологическим партнёро

11 часов назад

Веб‑версия WhatsApp** получила поддержку голосовых и видеозвонков

Веб‑версия мессенджера WhatsApp** получила поддержку аудио‑ и видеозвонков. Ранее эти функции были доступны только в десктопном и мобильных приложениях. Читать далее

11 часов назад

1 224 сотрудника западных AI-лабораторий попросили США придумать, как притормозить AI

1 224 сотрудника OpenAI, Anthropic, Google, Meta и других компаний подписали заявление Pacing the Frontier. Они просят правительство США поддержать международную разработку механизмов, которые позволя

11 часов назад

Книга Fortune представило ежегодный рейтинг Global 500

Книга Fortune представило ежегодный рейтинг Global 500. Среди российских компаний самое высокое место занял Сбер: за два года банк поднялся со 216-й на 64-ю строчку. За ним следуют «Газпром», занявший