本章小结

核心要点回顾

  1. 范式转变:从存储导向到检索导向——记忆的价值在于在正确时间检索正确信息,而非存储更多数据。上下文窗口是具有机会成本的经济资源。

  2. 四层记忆模型:工作记忆(上下文窗口)、短期记忆(会话历史)、长期记忆(外部存储)、情景记忆(决策轨迹)各司其职,形成完整的记忆体系。

  3. U 型注意力曲线:模型注意力在上下文开头和结尾最强,中间区域召回率下降 10-40%。关键信息应放在开头(系统提示)和结尾(当前任务)。

  4. 10 倍成本差异:缓存命中的 tokens 成本仅为未缓存的 1/10。设计缓存友好的提示结构是成本优化的关键杠杆。

  5. 压缩的代价:递归摘要仅 35.3% 准确率。结构化摘要通过强制保留关键字段,比自由摘要更可靠。

  6. 三层信息架构:L1(元数据,始终加载)→ L2(指令,按需加载)→ L3(数据,即时加载),可节省 87% token 消耗。

  7. 四策略框架:缓存优化(预防)→ 观察遮蔽(早期干预)→ 压缩策略(主动管理)→ 分区策略(架构解决),形成层层防御。

  8. Agentic RAG:从被动检索进化为主动决策。GraphRAG 在关系推理场景下准确率提升 20-35%,减少 30% 幻觉。

  9. 自我进化:五层记忆架构 + 自动化更新流程,让 AI 副本能够持续学习和演化。

记忆管理成长路径

入门阶段 - 熟练使用 /compact/clear 命令 - 理解 AGENTS.md 的三层结构(用户级/项目级/子目录级) - 能在任务节点主动压缩对话

进阶阶段 - 设计三层信息架构(L1/L2/L3) - 使用带指令的 /compact 精确控制保留内容 - 创建文件式长期记忆(WORKING_PLAN.md、REMEMBER.md) - 实施缓存优化策略

精通阶段 - 设计分层记忆架构(短期/中期/长期) - 实施四策略框架进行上下文优化 - 为团队制定上下文管理规范 - 构建具有自我进化能力的智能体记忆系统

下一章预告

第 7 章工具扩展将介绍如何通过 MCP 协议和外部工具扩展智能体能力,包括金融数据 API 接入、自定义工具开发和 Plugin 系统。工具输出的记忆管理将直接应用本章的观察遮蔽策略——毕竟,工具输出占据了 83.9% 的 tokens。