22 апреля 2026, 15:58

Ai2 предложил метод обновлять навыки LLM по одному без полного переобучения

1 мин

Институт Allen Institute for AI показал способ BAR — новый подход к посттрейну, который даёт возможность добавлять или улучшать отдельные навыки модели без полного ретрейна.

Суть в том, что модель разбивается на доменных «экспертов» (математика, код, tool use и т.д.), которые обучаются независимо, а затем объединяются в MoE-систему через обучаемый роутер.

Главное преимущество — отсутствие «разрушения» уже выученных навыков. Например:
обновление код-эксперта с помощью RL даёт +16.5 пункта к качеству программирования практически без влияния на другие области
внедрение RL к математическому эксперту даёт +13 пунктов

В классическом пайплайне любое усовершенствование требует переобучения всей модели, и стоимость растёт квадратично. В BAR обновление масштабируется линейно — меняется только необходимый адрес сайта.

Технически метод строится на поэтапном «размораживании» параметров:
на ранних стадиях общие веса заморожены
на этапе SFT частично открываются эмбеддинги и выходные слои
на RL-этапе размораживается вся схема, в том числе внимание.

После обучения эксперты объединяются:
общие параметры усредняются
роутер дообучается на маленький (около 5%) выборке

Итоговая схема BAR-5x7B на базе Olmo 2 7B показывает лучшие результаты, чем классическое монолитное дообучение и альтернативные MoE-подходы.

ии нейросети машинное+обучение ai

Читают сейчас

6 часов назад

Регулятор США планирует запретить компаниям продавать продукцию DJI под другими брендами

Федеральная комиссия по связи США (FCC) планирует запретить продукцию компаний, подозреваемых в продаже переименованных и модифицированных дронов и камер китайской DJI. В частности, ведомство намерено

6 часов назад

Центробанк предложил запретить подросткам регистрировать электронные кошельки без согласия родителей

Центробанк предложил перекрыть ещё один канал, через который мошенники вовлекают подростков в финансовые схемы, пишут «Известия». В контексте пакета «Антифрод 3.0» несовершеннолетним могут запретить р

6 часов назад

В России зафиксировали увеличение доли ИИ-трафика на сайтах СМИ и электронной коммерции

Лидерами по количеству ИИ‑трафика в июне 2026 года стали сайты электронной коммерции и медиа, рассказали «Ъ» в Servicepipe. На нейросети и ботов, которые обращаются к ресурсам СМИ и e‑com, приходится

6 часов назад

Версия интерфейса для упрощения настройки параметров сети NetworkManager 1.58

20 июля 2026 года состоялся выпуск интерфейса для упрощения настройки параметров сети NetworkManager 1.58. Версия стабильной версии NetworkManager 1.50 произошёл в октябре 2024 года. Версия NetworkMan

7 часов назад

Японская организация SDRS представила кабину для охлаждения людей Do Hiemon Box

Японская компания SDRS представила кабину для охлаждения людей Do Hiemon Box в сильную жару. Похожее на большой холодильник устройство уже привлекло внимание на фоне глобального повышения температуры