ИИ должен учиться непрерывно, чтобы стать AGI. Но с этим задача

3 мин
ИИ должен учиться непрерывно, чтобы стать AGI. Но с этим задача

Чтобы приблизиться к настоящему универсальному ИИ (AGI), схема должна уметь дообучаться без остановки — впитывать новые факты и навыки прямо по мере работы. Новое исследование лаборатории Zyphra показало, что большие языковые модели справляются с этим плохо: после долгого обучения они постепенно теряют саму способность усваивать новое. Важно не перепутать: речь не про забывание и не про "поглупение". Старое схема помнит прекрасно — она именно разучивается учиться. Похоже на опытного сотрудника, который ничего из накопленного не растерял, но за годы в одной колее все тяжелее берется за незнакомые задачи. У этого явления есть имя — потеря пластичности.

Чтобы поймать эффект, модели разных размеров — от 5 до 314 млн параметров — долго прогоняли через поток из восьми языков (английский, русский, китайский, французский, японский и так далее), а время от времени проверяли, насколько быстро они выучивают совсем свежий язык, которого в потоке не было, — вьетнамский. Картина получилась наглядной: чем дольше шло обучение, тем хуже модели давался этот новичок.

Основной вопрос был про масштаб: спасает ли он? И да, и нет. Чем крупнее схема, тем позже наступает эта "закостенелость" — но "никогда" не наступает ни у одной. Размер лишь оттягивает момент, причем со все меньшей отдачей: момент наступления подчиняется простому степенному закону и растет медленнее, чем сама модель. Грубо говоря, просто раздуть модель, чтобы избавиться от проблемы, не выйдет — это неэффективный путь. По прогнозу из той же формулы (именно прогноз, прямых замеров на таких размерах нет) модель на миллиард параметров начала бы терять пластичность примерно к 1,8 трлн обработанных токенов. И самый неуютный результат: эффект проявился даже при обычном длительном предобучении на стационарных данных, а не только в искусственном сценарии с резким переключением языков.

Почему это вообще занимает исследователей. Непрерывное обучение могло бы снять одну из главных болей нынешних моделей — knowledge cuttof или фиксированную "дату знаний", после которой модель ничего не знает о мире. Тот же алгоритм позволил бы, например, кодинг-агенту осваивать новую кодовую базу по ходу дела, а не затаскивать ее полностью в гигантский промпт. Если же способность учиться со временем тает, вся эта картина непрерывно адаптирующегося ИИ упирается в стену.

Важно, что модели в эксперименте небольшие по меркам фронтира; цифры про миллиард параметров — экстраполяция, а не наблюдение. Механизма разработчики тоже пока не нашли: они проверили обычных подозреваемых — затухающие нейроны, "обленившиеся" головы внимания, рост весов, — но ни один не объясняет эффект целиком.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

85 процентов австралийских подростков продолжают заходить в соцсети после запрета

7 минут назад

85 процентов австралийских подростков продолжают заходить в соцсети после запрета

Запрет соцсетей для подростков в Австралии оказался неэффективным: несовершеннолетние обходят ограничения, используя приватные браузеры и VPN, создавая фейковые аккаунты или заходя через аккаунты боле

Apple повысила стоимость восстановленных по программе Certified Refurbished ноутбуков Mac и планшетов iPad

15 минут назад

Apple повысила стоимость восстановленных по программе Certified Refurbished ноутбуков Mac и планшетов iPad

Apple объявила о повышении стоимости компьютеров Mac и планшетов iPad, восстановленных по программе Certified Refurbished. Американская организация пошла на такой шаг после увеличения цены своих новых

Большое апдейт «Станции Дуо Макс»: установка APK, звонки через «Телемост» и умный дом на экране

15 минут назад

Большое апдейт «Станции Дуо Макс»: установка APK, звонки через «Телемост» и умный дом на экране

«Яндекс» показал июньское обновление умных устройств. В этом месяце команда сконцентрировалась на улучшении большой «Станции Дуо Макс» с полноценным экраном. В обновлении добавили звонки через «Телемо

OpenAI просят не выкатывать GPT‑5.6 на всеобщее обозрение

16 минут назад

OpenAI просят не выкатывать GPT‑5.6 на всеобщее обозрение

Белый дом вежливо, но настойчиво попросил OpenAI отложить публичный релиз GPT‑5.6. Предварительный доступ к ней просят выдать только американским компаниям и организациям из «белого списка» правительс

20 минут назад

«Яндекс Браузер» для организаций теперь поддерживает ГОСТ TLS и работает с электронной виртуальный подписью на Android

«Яндекс Браузер» для организаций теперь поддерживает российские алгоритмы шифрования (ГОСТ TLS) и электронную цифровую подпись (ЭЦП) в версии для Android. Благодаря этому сотрудники компаний, которые