[AI]《ByteRover: Agent-Native Memory Through LLM-Curated Hierarchical Context》A Nguyen, D Doan, H Pham, B Ha… [ByteRover] (2026)
在LLM记忆增强系统领域,当代理将知识委托给外部管道(向量数据库、图谱提取服务)存储时,存储系统并不理解它所存储的内容。这导致三种硬伤:代理意图与实际存储内容之间的语义漂移、多代理协作时上下文溯源的丢失、以及故障恢复时状态难以重建。
本文的核心洞见是:把"记忆"从外部服务重新看作代理自身推理循环的一等工具。由此,同一个LLM既负责任务推理,也负责将知识组织进层级化Context Tree(领域→主题→子主题→条目),每条记录携带显式关系、来源溯源与生命周期分数。5层渐进检索策略使多数查询在无需调用LLM的情况下于百毫秒内完成;写入时的逐操作反馈则让代理能实时感知并修正存储失败。
这项工作真正留下的遗产是:证明零外部基础设施(无向量库、无图数据库)的纯文件系统记忆方案可在LoCoMo上达到当前最优精度。它为后来者打开的新门是:将记忆管理的认知控制权还给LLM本身,使记忆结构对人类可读、可版本控制。但尚未跨过的门槛是:LLM策划知识的写入代价高昂,无法支撑高频实时数据流;且当知识库超越万条条目量级时,单机文件索引的扩展边界已清晰可见。
arxiv.org/abs/2604.01599 机器学习 人工智能 论文 AI创造营


