Ai2 предложил метод обновлять навыки LLM по одному без полного переобучения

1 мин
Ai2 предложил метод обновлять навыки LLM по одному без полного переобучения

Институт Allen Institute for AI показал способ BAR — новый подход к посттрейну, который даёт возможность добавлять или улучшать отдельные навыки модели без полного ретрейна.

Суть в том, что модель разбивается на доменных «экспертов» (математика, код, tool use и т.д.), которые обучаются независимо, а затем объединяются в MoE-систему через обучаемый роутер.

Главное преимущество — отсутствие «разрушения» уже выученных навыков. Например:
обновление код-эксперта с помощью RL даёт +16.5 пункта к качеству программирования практически без влияния на другие области
внедрение RL к математическому эксперту даёт +13 пунктов

В классическом пайплайне любое усовершенствование требует переобучения всей модели, и стоимость растёт квадратично. В BAR обновление масштабируется линейно — меняется только необходимый адрес сайта.

Технически метод строится на поэтапном «размораживании» параметров:
на ранних стадиях общие веса заморожены
на этапе SFT частично открываются эмбеддинги и выходные слои
на RL-этапе размораживается вся схема, в том числе внимание.

После обучения эксперты объединяются:
общие параметры усредняются
роутер дообучается на маленький (около 5%) выборке

Итоговая схема BAR-5x7B на базе Olmo 2 7B показывает лучшие результаты, чем классическое монолитное дообучение и альтернативные MoE-подходы.

Читают сейчас

ITFB Group вошла в рейтинг лидеров рынка поставщиков ИТ-оборудования по версии CNews

44 минуты назад

ITFB Group вошла в рейтинг лидеров рынка поставщиков ИТ-оборудования по версии CNews

ITFB Group вошла в два ежегодных рейтинга CNews Analytics: «Крупнейшие поставщики инфраструктуры дата-центров» и «Крупнейшие поставщики физической ИТ-инфраструктуры». Это признание подтверждает высоки

Selectel показал собственный хост, оптимизированный для AI-задач

1 час назад

Selectel показал собственный хост, оптимизированный для AI-задач

Привет, ! 22 апреля мы презентовали новый высокопроизводительный сервер для AI-задач. Акцент сделали на оптимизации взаимодействия процессора, RAM, GPU и накопителей. Что скрывается под капотом, а рав

Владельцы смартфонов Pixel 10 сообщают о проблемах с GPS

1 час назад

Владельцы смартфонов Pixel 10 сообщают о проблемах с GPS

Владельцы смартфонов Pixel 10 сообщают о проблемах с GPS, жалобы обнаружили эксперты из Android Authority. По их данным, за последние месяцы на форумах сообщества Pixel и в сабреддите Pixel на Reddit

Обновления MWS Cloud Platform в апреле

1 час назад

Обновления MWS Cloud Platform в апреле

Привет, ! Делимся свежими обновлениями MWS Cloud Platform за последние месяцы. Добавили некоторое количество функций, которые упрощают повседневную работу с инфраструктурой — от мониторинга производит

Участникам программы Windows Insider доступна сборка Windows 11 с режимом Xbox Mode

2 часа назад

Участникам программы Windows Insider доступна сборка Windows 11 с режимом Xbox Mode

Участники программы Windows Insider в канале Release Preview получили доступ к двум новым сборкам операционной системы — 26100.8313 и 26200.8313 (KB5083631). Главным новшеством стал режим Xbox Mode, к