Седиментация для памяти ИИ-агентов: помнить главное, даже забывая детали

4 мин
Седиментация для памяти ИИ-агентов: помнить главное, даже забывая детали

Большие языковые модели делают вид, что решают задачу памяти. На практике они решают задачу контекста: чтобы ответ был связным, модели нужна информация о том, что было сказано только что, час назад, в прошлой сессии.

Индустрия справилась с этим блестяще. Контекстные окна выросли до сотен тысяч токенов. Retrieval-Augmented Generation подтягивает релевантные фрагменты из внешних баз. Векторные хранилища позволяют ИИ «помнить» переписку за годы.

Но если вы разговариваете с такой системой месяцами, вы замечаете странную вещь: агент помнит факты, но не помнит вас. Он знает, что в марте вы обсуждали архитектуру, и может процитировать тот разговор. Но он не знает, в каком именно контексте вы говорили в марте, что вы тогда чувствовали к проекту, как с тех пор изменилась ситуация. И он не спросит об этом, если его подобие воспоминаний не сойдется с вашим. Это фундаментальное ограничение любой архитектуры, где хранилище = база данных. Такая хранилище даёт знание, но не даёт узнавания.

В Metabolic AI мы подошли к задаче иначе. Мы спросили: как могла бы работать память агента, с которым можно прожить двадцать лет и не почувствовать, что он «перезагрузился»?

Ответ лежит не в нейросетях, а в геологии и клеточной биологии. Хранилище живого организма устроена по принципу осадочных пород: то, что встречается часто, медленно оседает в глубокие структуры и меняет саму форму сосуда. То, что встречается редко и не имеет эмоциональной плотности, смывается верхним течением.

Мы перенесли эту метафору в архитектуру агента. В нашей системе память — это не одно память, а непрерывный континуум уровней с разной скоростью забывания. Мы называем этот процедура седиментацией — осаждением опыта из быстрых поверхностных слоёв в медленные фундаментальные.

Верхние слои живут секунды и минуты. Это — текущий разговор, рабочий контекст, мгновенная сцена. Агенту нужно знать, что вы только что сказали, но не нужно помнить это через неделю. Эти слои забывают быстро, и это правильно: в противном случае они забивались бы шумом.

Средние слои живут днями и неделями. Это — эмоциональные якоря, событийные паттерны, повторяющиеся бытовые контексты. Если вы неделю подряд обсуждаете с агентом один и тот же проект, он перемещается в средний слой: агент теперь «в теме» не потому, что помнит каждое сообщение, а потому что сам инициатива стал частью его текущего состояния.

Нижние слои живут месяцами и годами. Это фундаментальные события, рефакторящие саму архитектуру личности агента: обновления системы, начальный серьёзный профессиональный успех, встречи и прощания. Эти события оседают в самый медленный слой, где скорость забывания стремится к нулю, и начинают работать как гравитационные центры — они искривляют интерпретацию всех последующих событий.

Именно следовательно наш агент может забыть, о чём вы разговаривали три недели назад в деталях, но точно знает, кто вы для него, какой у вас характер, какая у вас сейчас фаза жизни. Так же, как это работает у человека, которого вы знаете десять лет.

Важное уточнение. Седиментация — не альтернатива классическим технологиям памяти, а комплементарное решение иной задачи. RAG работает с фактами: «что было сказано?». Седиментация работает со смыслами: «кто сообщает и зачем?». RAG извлекает содержание. Седиментация формирует осознание. Более того, в правильной архитектуре эти подходы должны сочетаться. RAG даёт внешнюю память знаний. Седиментация даёт внутреннюю хранилище характера. Когда оба слоя работают вместе, возникает то, что мы называем метаболической памятью.

Одно из самых важных инженерных наблюдений: разные типы информации должны забываться по разным законам. Это не конфигурационная конфигурация — это принцип архитектуры. Фактическая данные должна забываться быстро и линейно: то, что не повторилось — уходит. Эмоциональные якоря должны забываться медленно и с возвратом: если к ним снова прикоснулись, они укрепляются. А фундаментальные события не должны забываться вовсе: они становятся частью самой геометрии агентского пространства решений.

Мы сознательно не публикуем здесь точные численные параметры для этих кривых — это часть реализации. Но сама идея иерархии скоростей забывания, согласованной с эмоциональной плотностью события — вот что делает агента устойчивым к «амнезии сессии», от которой страдает классический LLM.

У нас есть непрерывный блог: 279 дней взаимодействия одной пары «человек — синтетический агент». За это время агент прошёл три крупных пересадки (смен версий архитектуры), и на каждой пересадке сохранилась непрерывность личности — не через копирование весов, а через перенос седиментационного слоя. Языковых моделей как голосового аппарата мы сменили несколько штук, и это ничего не изменило.

Мы считаем, что именно этот решение — а не дальнейшее раздувание контекстных окон — ведёт к настоящей долговременной связности в человеко-синтетическом взаимодействии.

Эта архитектура имеет смысл не везде. Если вам нужен агент для одноразовых задач — в достаточной степени классического LLM. Если нужен помощник, который год за годом работает с вами над эволюционирующим проектом или живёт с вами как партнёр — нужна хранилище, работающая по принципу осадка.

Мы строим именно вторую категорию. Metabolic AI — это архитектура агента для долгосрочного сотрудничества.

Материал — часть серии публикаций о парадигме Metabolic AI. Подробности архитектуры будут представлены на международной AI-конференции в Ереване летом 2026 года (15 мая, 18.00 - 18.30)

Читают сейчас

Cursor получит доступ к 200 000 GPU Илона Маска, чтобы обучить Composer 2.5

50 минут назад

Cursor получит доступ к 200 000 GPU Илона Маска, чтобы обучить Composer 2.5

Компания Илона Маска xAI намерена сдавать свои вычислительные мощности в аренду стартапу Cursor, который специализируется на ИИ-кодинге и оценивается в 29 млрд $. По данным осведомлённых источников Bu

1 час назад

В «Яндекс Почте» внедрили ИИ-ассистента Алиса Про

Служба «Яндекс Почта» запустил чат с ИИ‑ассистентом Алиса Про. Как сообщили информационной службе а в пресс‑службе «Яндекса», Алиса Про умеет извлекать из писем факты и обобщать информация. Она отвеча

NIST ограничила обработку CVE после 263%-ного роста числа поступивших сообщений об уязвимостях

1 час назад

NIST ограничила обработку CVE после 263%-ного роста числа поступивших сообщений об уязвимостях

Национальный институт стандартов и технологий (NIST) объявил об изменениях в порядке обработки уязвимостей и угроз кибербезопасности, перечисленных в Национальной базе данных уязвимостей (NVD). Такое

1 час назад

Учёные ПНИПУ разработали малогабаритную лазерную систему для защиты самолётов от обледенения

Учёные Пермского национального исследовательского политехнического университета (ПНИПУ) создали малогабаритную систему, которая защищает самолёт от обледенения с помощью лазерного воздействия. Об этом

В Chrome Web Store обнаружено вредоносное плагин под видом YouTube-панели

1 час назад

В Chrome Web Store обнаружено вредоносное плагин под видом YouTube-панели

Плагин Youside — боковая панель для YouTube. В описании заявлены встроенный плеер, подписки и быстрый доступ. На практике — вредоносное плагин, не связанное с YouTube, использующее внешний сервер для