OpenJarvis: каркас все-в-одном для ИИ-агентов

2 мин
OpenJarvis: каркас все-в-одном для ИИ-агентов

Stanford SAIL замерили, насколько эффективно локальные языковые модели конвертируют электроэнергию в полезные вычисления и назвали этот показатель "intelligence per watt".

Они прогнали больше миллиона реальных запросов через 20+ моделей на 8 разных ускорителях и выяснили: с 2023 по 2025 год производительность локального инференса выросла в 5,3 раза, а современные небольшие модели уже справляются с 88,7% обычных чат- и ризонинг-запросов. Железо и алгоритмы готовы, но не хватало софта.

Так появился OpenJarvis: публичный фреймворк, который превращает эти выводы в инфраструктуру для персональных ИИ-агентов, работающих на устройстве пользователя.

Разработчики проводят параллель с PyTorch: OpenJarvis должен стать для локального ИИ тем, чем PyTorch стал для глубокого обучения - стандартной инфраструктурой, на которой строится все остальное.

Каркас структурирован вокруг 5 примитивов:

  • Intelligence - слой языковых моделей с единым каталогом, где не нужно самому отслеживать релизы и считать хранилище.

  • Engine - бэкенд инференса: Ollama, vLLM, SGLang, llama.cpp, Apple Foundation Models и другие. Openjarvis сам определяет железо и рекомендует конфигурацию.

  • Agents - слой поведения: роли оркестратора и исполнителя рутинных сценариев, адаптированные под ограниченный контекст и память на устройстве.

  • Tools & Memory - интеграции через MCP и Google A2A, семантическая индексация локальных документов, подключение к iMessage, Telegram и т.д.

  • Learning - алгоритм адаптации: локальные трейсы превращаются в обучающие информация через SFT, LoRA и GRPO. Система сама упаковывает этот процедура в рабочий флоу.

Отдельная фишка - решение к эффективности. OpenJarvis профилирует энергопотребление на NVIDIA, AMD и Apple Silicon с интервалом 50 мс.

Применять можно через CLI, браузерный дашборд или десктопное приложение для macOS, Linux и Windows. Для полного функционала (безопасность, инструменты, агенты) потребуется Rust.

Каркас доступен на GitHub. В дополнение к этого, есть документы.

Читают сейчас

Lenovo с июля повысит цены на свою технику

1 час назад

Lenovo с июля повысит цены на свою технику

По данным китайских СМИ, Lenovo со следующего месяца повысит цены на всю свою технику. Компания приняла это решение на внутреннем рабочем совещании ещё в мае этого года. Читать далее

Moonshot AI выпустили Kimi-K2.7-Code

1 час назад

Moonshot AI выпустили Kimi-K2.7-Code

Moonshot AI выпустили Kimi-K2.7-Code — новую версию своей coding-модели на базе K2.6. Веса открыты на HuggingFace под лицензией Modified MIT. По бенчмаркам прирост по сравнению с K2.6 составил +21.8%

NBC News и iFixit: телефон Trump T1 Phone практически целиком повторяет конструкцию HTC U24 Pro

1 час назад

NBC News и iFixit: телефон Trump T1 Phone практически целиком повторяет конструкцию HTC U24 Pro

Специалисты iFixit и журналисты NBC News получили в своё распоряжение смартфон Trump T1 Phone, который оказался практически полной копией тайваньского HTC U24 Pro, вышедшего в 2024 году. Поставки моби

Девять лет, как битломаны запустили ИИ-революцию

2 часа назад

Девять лет, как битломаны запустили ИИ-революцию

12 июня 2017 года группой битломанов из Google была опубликована статья под названием "Attention Is All You Need", в которой миру впервые были представлены трансформеры — новый тип нейронных сетей, ко

Gartner: К 2030 году энергосети, возможно, не справятся с растущим спросом ИИ‑систем в мире

2 часа назад

Gartner: К 2030 году энергосети, возможно, не справятся с растущим спросом ИИ‑систем в мире

К 2030 году энергосети, возможно, не справятся с растущим спросом ИИ‑систем — потребление энергии дата‑центрами может вырасти на 26% год к году уже в этом году, сообщает The Register со ссылкой на про