第 6 章 记忆管理和上下文工程
提示🎧 本章配套播客
重要学习目标
- 理解 智能体记忆系统的认知科学基础,区分工作记忆、短期记忆、长期记忆、情景记忆的特点与功能
- 理解 上下文工程范式的核心思想,掌握从存储导向到检索导向的范式转变
- 应用 U 型注意力曲线原理优化信息放置策略,最大化关键信息的召回率
- 应用 三层信息架构(L1/L2/L3)和四策略框架进行上下文优化
- 分析 不同压缩策略的代价与收益,选择适合任务特征的压缩方法
- 创造 设计具有分层记忆架构的智能体系统,实现短期、中期、长期记忆的协同管理
- 评价 在给定场景中评估记忆管理策略的成本效益,平衡信息保留与上下文空间

想象这样一个场景:你是某私人银行的智能理财顾问,正在服务一位 VIP 客户。客户三个月前曾表达过对 ESG 投资的兴趣,上周讨论了孩子的教育金规划,今天又提到想了解海外资产配置。如果你记不住这些对话历史,每次都要客户从头解释需求,服务体验会大打折扣。
这就是本章要解决的问题:如何让智能体具备高效的记忆能力?
记忆管理的关键不是存多少,而是在正确的时间找到正确的信息。这就是上下文工程的核心思想——不追求无限大的上下文窗口,而是追求高信号密度的信息检索。
本章将从认知科学出发,建立智能体记忆的四层架构:工作记忆(上下文窗口)、短期记忆(会话历史)、长期记忆(外部存储)、情景记忆(决策轨迹)。然后深入探讨上下文工程的核心技术:U 型注意力曲线、缓存优化、压缩策略、分区策略。最后通过一个真实的自我进化 AI 副本案例,展示所有概念如何在实践中协同工作。