13 марта 2026, 20:14
OpenJarvis: каркас все-в-одном для ИИ-агентов


Stanford SAIL замерили, насколько эффективно локальные языковые модели конвертируют электроэнергию в полезные вычисления и назвали этот показатель "intelligence per watt".
Они прогнали больше миллиона реальных запросов через 20+ моделей на 8 разных ускорителях и выяснили: с 2023 по 2025 год производительность локального инференса выросла в 5,3 раза, а современные небольшие модели уже справляются с 88,7% обычных чат- и ризонинг-запросов. Железо и алгоритмы готовы, но не хватало софта.
Так появился OpenJarvis: публичный фреймворк, который превращает эти выводы в инфраструктуру для персональных ИИ-агентов, работающих на устройстве пользователя.
Разработчики проводят параллель с PyTorch: OpenJarvis должен стать для локального ИИ тем, чем PyTorch стал для глубокого обучения - стандартной инфраструктурой, на которой строится все остальное.

Каркас структурирован вокруг 5 примитивов:
Intelligence - слой языковых моделей с единым каталогом, где не нужно самому отслеживать релизы и считать хранилище.
Engine - бэкенд инференса: Ollama, vLLM, SGLang, llama.cpp, Apple Foundation Models и другие. Openjarvis сам определяет железо и рекомендует конфигурацию.
Agents - слой поведения: роли оркестратора и исполнителя рутинных сценариев, адаптированные под ограниченный контекст и память на устройстве.
Tools & Memory - интеграции через MCP и Google A2A, семантическая индексация локальных документов, подключение к iMessage, Telegram и т.д.
Learning - алгоритм адаптации: локальные трейсы превращаются в обучающие информация через SFT, LoRA и GRPO. Система сама упаковывает этот процедура в рабочий флоу.
Отдельная фишка - решение к эффективности. OpenJarvis профилирует энергопотребление на NVIDIA, AMD и Apple Silicon с интервалом 50 мс.

Применять можно через CLI, браузерный дашборд или десктопное приложение для macOS, Linux и Windows. Для полного функционала (безопасность, инструменты, агенты) потребуется Rust.
Каркас доступен на GitHub. В дополнение к этого, есть документы.
Читают сейчас

1 час назад
Lenovo с июля повысит цены на свою технику
По данным китайских СМИ, Lenovo со следующего месяца повысит цены на всю свою технику. Компания приняла это решение на внутреннем рабочем совещании ещё в мае этого года. Читать далее

1 час назад
Moonshot AI выпустили Kimi-K2.7-Code
Moonshot AI выпустили Kimi-K2.7-Code — новую версию своей coding-модели на базе K2.6. Веса открыты на HuggingFace под лицензией Modified MIT. По бенчмаркам прирост по сравнению с K2.6 составил +21.8%

1 час назад
NBC News и iFixit: телефон Trump T1 Phone практически целиком повторяет конструкцию HTC U24 Pro
Специалисты iFixit и журналисты NBC News получили в своё распоряжение смартфон Trump T1 Phone, который оказался практически полной копией тайваньского HTC U24 Pro, вышедшего в 2024 году. Поставки моби

2 часа назад
Девять лет, как битломаны запустили ИИ-революцию
12 июня 2017 года группой битломанов из Google была опубликована статья под названием "Attention Is All You Need", в которой миру впервые были представлены трансформеры — новый тип нейронных сетей, ко

2 часа назад
Gartner: К 2030 году энергосети, возможно, не справятся с растущим спросом ИИ‑систем в мире
К 2030 году энергосети, возможно, не справятся с растущим спросом ИИ‑систем — потребление энергии дата‑центрами может вырасти на 26% год к году уже в этом году, сообщает The Register со ссылкой на про