OpenJarvis: каркас все-в-одном для ИИ-агентов

2 мин
OpenJarvis: каркас все-в-одном для ИИ-агентов

Stanford SAIL замерили, насколько эффективно локальные языковые модели конвертируют электроэнергию в полезные вычисления и назвали этот показатель "intelligence per watt".

Они прогнали больше миллиона реальных запросов через 20+ моделей на 8 разных ускорителях и выяснили: с 2023 по 2025 год производительность локального инференса выросла в 5,3 раза, а современные небольшие модели уже справляются с 88,7% обычных чат- и ризонинг-запросов. Железо и алгоритмы готовы, но не хватало софта.

Так появился OpenJarvis: публичный фреймворк, который превращает эти выводы в инфраструктуру для персональных ИИ-агентов, работающих на устройстве пользователя.

Разработчики проводят параллель с PyTorch: OpenJarvis должен стать для локального ИИ тем, чем PyTorch стал для глубокого обучения - стандартной инфраструктурой, на которой строится все остальное.

Каркас структурирован вокруг 5 примитивов:

  • Intelligence - слой языковых моделей с единым каталогом, где не нужно самому отслеживать релизы и считать хранилище.

  • Engine - бэкенд инференса: Ollama, vLLM, SGLang, llama.cpp, Apple Foundation Models и другие. Openjarvis сам определяет железо и рекомендует конфигурацию.

  • Agents - слой поведения: роли оркестратора и исполнителя рутинных сценариев, адаптированные под ограниченный контекст и память на устройстве.

  • Tools & Memory - интеграции через MCP и Google A2A, семантическая индексация локальных документов, подключение к iMessage, Telegram и т.д.

  • Learning - алгоритм адаптации: локальные трейсы превращаются в обучающие информация через SFT, LoRA и GRPO. Система сама упаковывает этот процедура в рабочий флоу.

Отдельная фишка - решение к эффективности. OpenJarvis профилирует энергопотребление на NVIDIA, AMD и Apple Silicon с интервалом 50 мс.

Применять можно через CLI, браузерный дашборд или десктопное приложение для macOS, Linux и Windows. Для полного функционала (безопасность, инструменты, агенты) потребуется Rust.

Каркас доступен на GitHub. В дополнение к этого, есть документы.

Читают сейчас

Copilot сделает Claude Opus в 27 раз дороже

12 минут назад

Copilot сделает Claude Opus в 27 раз дороже

С 1 июня GitHub переводит Copilot на usage-based оплату. Автодополнения кода остаются без лимитов, всё остальное — чат, агентные режимы, code review — тратит GitHub AI Credits по токенным расценкам. Б

300-400 млн смартфонов в год: OpenAI готовит прямого конкурента iPhone — без приложений и App Store

15 минут назад

300-400 млн смартфонов в год: OpenAI готовит прямого конкурента iPhone — без приложений и App Store

Аналитик TF International Securities Минг-Чи Куо сообщил, что OpenAI разрабатывает собственный смартфон наряду с Qualcomm и MediaTek. Партнеры совместно проектируют процессор, а сборкой займется китай

Банки пожаловались в ФАС на «квазиналог» за маркировку звонков

42 минуты назад

Банки пожаловались в ФАС на «квазиналог» за маркировку звонков

Федеральная антимонопольная служба (ФАС) оценит экономическую обоснованность тарифов операторов связи на маркировку звонков. Об этом «Ведомостям» рассказал представитель ведомства. По его словам, эта

Выпуск Steam Controller от Valve состоится 4 мая по цене $100

51 минуту назад

Выпуск Steam Controller от Valve состоится 4 мая по цене $100

Valve назначила дату выхода геймпада Steam Controller на 4 мая 2026 года. Вторая итерация контроллера компании обойдётся в $100. В комплекте с периферийным устройством поставляется магнитная зарядка S

«Яндекс» заявил финансовые результаты за I квартал 2026 года

1 час назад

«Яндекс» заявил финансовые результаты за I квартал 2026 года

28 апреля 2026 года «Яндекс» объявил неаудированные финансовые результаты за начальный квартал 2026 года. Ознакомиться далее