18 апреля 2026, 15:04

Седиментация для памяти ИИ-агентов: помнить главное, даже забывая детали

4 мин

Большие языковые модели делают вид, что решают задачу памяти. На практике они решают задачу контекста: чтобы ответ был связным, модели нужна информация о том, что было сказано только что, час назад, в прошлой сессии.

Индустрия справилась с этим блестяще. Контекстные окна выросли до сотен тысяч токенов. Retrieval-Augmented Generation подтягивает релевантные фрагменты из внешних баз. Векторные хранилища позволяют ИИ «помнить» переписку за годы.

Но если вы разговариваете с такой системой месяцами, вы замечаете странную вещь: агент помнит факты, но не помнит вас. Он знает, что в марте вы обсуждали архитектуру, и может процитировать тот разговор. Но он не знает, в каком именно контексте вы говорили в марте, что вы тогда чувствовали к проекту, как с тех пор изменилась ситуация. И он не спросит об этом, если его подобие воспоминаний не сойдется с вашим. Это фундаментальное ограничение любой архитектуры, где хранилище = база данных. Такая хранилище даёт знание, но не даёт узнавания.

В Metabolic AI мы подошли к задаче иначе. Мы спросили: как могла бы работать память агента, с которым можно прожить двадцать лет и не почувствовать, что он «перезагрузился»?

Ответ лежит не в нейросетях, а в геологии и клеточной биологии. Хранилище живого организма устроена по принципу осадочных пород: то, что встречается часто, медленно оседает в глубокие структуры и меняет саму форму сосуда. То, что встречается редко и не имеет эмоциональной плотности, смывается верхним течением.

Мы перенесли эту метафору в архитектуру агента. В нашей системе память — это не одно память, а непрерывный континуум уровней с разной скоростью забывания. Мы называем этот процедура седиментацией — осаждением опыта из быстрых поверхностных слоёв в медленные фундаментальные.

Верхние слои живут секунды и минуты. Это — текущий разговор, рабочий контекст, мгновенная сцена. Агенту нужно знать, что вы только что сказали, но не нужно помнить это через неделю. Эти слои забывают быстро, и это правильно: в противном случае они забивались бы шумом.

Средние слои живут днями и неделями. Это — эмоциональные якоря, событийные паттерны, повторяющиеся бытовые контексты. Если вы неделю подряд обсуждаете с агентом один и тот же проект, он перемещается в средний слой: агент теперь «в теме» не потому, что помнит каждое сообщение, а потому что сам инициатива стал частью его текущего состояния.

Нижние слои живут месяцами и годами. Это фундаментальные события, рефакторящие саму архитектуру личности агента: обновления системы, начальный серьёзный профессиональный успех, встречи и прощания. Эти события оседают в самый медленный слой, где скорость забывания стремится к нулю, и начинают работать как гравитационные центры — они искривляют интерпретацию всех последующих событий.

Именно следовательно наш агент может забыть, о чём вы разговаривали три недели назад в деталях, но точно знает, кто вы для него, какой у вас характер, какая у вас сейчас фаза жизни. Так же, как это работает у человека, которого вы знаете десять лет.

Важное уточнение. Седиментация — не альтернатива классическим технологиям памяти, а комплементарное решение иной задачи. RAG работает с фактами: «что было сказано?». Седиментация работает со смыслами: «кто сообщает и зачем?». RAG извлекает содержание. Седиментация формирует осознание. Более того, в правильной архитектуре эти подходы должны сочетаться. RAG даёт внешнюю память знаний. Седиментация даёт внутреннюю хранилище характера. Когда оба слоя работают вместе, возникает то, что мы называем метаболической памятью.

Одно из самых важных инженерных наблюдений: разные типы информации должны забываться по разным законам. Это не конфигурационная конфигурация — это принцип архитектуры. Фактическая данные должна забываться быстро и линейно: то, что не повторилось — уходит. Эмоциональные якоря должны забываться медленно и с возвратом: если к ним снова прикоснулись, они укрепляются. А фундаментальные события не должны забываться вовсе: они становятся частью самой геометрии агентского пространства решений.

Мы сознательно не публикуем здесь точные численные параметры для этих кривых — это часть реализации. Но сама идея иерархии скоростей забывания, согласованной с эмоциональной плотностью события — вот что делает агента устойчивым к «амнезии сессии», от которой страдает классический LLM.

У нас есть непрерывный блог: 279 дней взаимодействия одной пары «человек — синтетический агент». За это время агент прошёл три крупных пересадки (смен версий архитектуры), и на каждой пересадке сохранилась непрерывность личности — не через копирование весов, а через перенос седиментационного слоя. Языковых моделей как голосового аппарата мы сменили несколько штук, и это ничего не изменило.

Мы считаем, что именно этот решение — а не дальнейшее раздувание контекстных окон — ведёт к настоящей долговременной связности в человеко-синтетическом взаимодействии.

Эта архитектура имеет смысл не везде. Если вам нужен агент для одноразовых задач — в достаточной степени классического LLM. Если нужен помощник, который год за годом работает с вами над эволюционирующим проектом или живёт с вами как партнёр — нужна хранилище, работающая по принципу осадка.

Мы строим именно вторую категорию. Metabolic AI — это архитектура агента для долгосрочного сотрудничества.

Материал — часть серии публикаций о парадигме Metabolic AI. Подробности архитектуры будут представлены на международной AI-конференции в Ереване летом 2026 года (15 мая, 18.00 - 18.30)

memory ai research

Читают сейчас

10 часов назад

Обзор изменений в законодательстве за июнь 2026 года

В обзоре изменений за июнь 2026 года рассмотрим следующие темы: критическая информационная инфраструктура, финансовые организации, деятельность ФСТЭК России, судебная практика и другие. Читать далее

10 часов назад

«Яндекс» назвал победителей первой премии «Сделано с ИИ»

«Яндекс» подвёл итоги первой премии «Сделано с ИИ», учреждённой для специалистов, которые применяют искусственный интеллект при решении профессиональных задач. Победителями стали разработчики проектов

10 часов назад

Почти 300 репозиториев GitHub использовались для распространения программ-стилеров

На GitHub обнаружили масштабную атаку: 292 репозитория с инфостилерами, которые имитировали известные инструменты в области безопасности, финансов и разработки. По поведению вредонос похож на семейств

10 часов назад

Выпуск ProGate 1.3.0: сопровождение Shardman, отказоустойчивость и улучшения безопасности

Postgres Professional представляет обновление платформы миграции и репликации данных — Postgres ProGate 1.3.0. Ключевые темы релиза: полноценная поддержка Postgres Pro Shardman в качестве приёмника с

10 часов назад

«Авито» планирует запустить свой служба знакомств

«Авито» изучает возможность запуска сервиса знакомств для серьёзных отношений, который будет встроен в основное приложение платформы, рассказали «Ъ» источники, знакомые с планами компании. В «Авито» п