情景记忆:决策轨迹与自我进化

交易执行智能体在复盘会议上被问到:2024 年 8 月 15 日那笔科技股交易是怎么决策的?如果它只记得最终结果(买入 1000 股,收益 12%),这个问题无法回答。但如果它记住了完整的决策过程——市场信号、分析逻辑、备选方案、最终选择——它就能进行有效复盘。

这就是情景记忆(Episodic Memory)的独特价值。它不同于事实性知识(知道什么),而是关于亲身体验(经历了什么)。对于智能体而言,情景记忆是实现经验学习和类比推理的关键。

6.5.1 情景记忆的独特价值

情景记忆与长期记忆有本质区别。长期记忆存储的是”通货膨胀会侵蚀购买力”这类知识;情景记忆存储的是”2024 年 8 月 15 日,我因为担心市场过热而建议客户分批买入科技股,结果平均成本降低 2.5%“这类经历。

重要核心概念:情景记忆的三要素
  1. 情境绑定:时间、地点、参与者、市场环境
  2. 叙事完整性:起因、经过、结果形成完整故事
  3. 反思标注:事后的经验教训和模式总结

情景记忆可以进一步区分为两类:

实体记忆:追踪实体的身份一致性。

  • Apple = AAPL = 那家做 iPhone 的公司
  • 张先生 = 客户 C001 = 风险偏好 R2 的退休教师

实体记忆确保智能体在不同语境下识别同一对象。当用户说”那家科技巨头”时,智能体能关联到之前讨论过的苹果公司。

事件记忆:记录时序序列和因果链条。

  • 分析苹果财报 → 识别增长放缓信号 → 推荐谨慎持有 → 客户减仓 20%
  • 美联储加息 → 科技股承压 → 调低估值目标

事件记忆是决策复盘和经验迁移的基础。

6.5.2 决策轨迹记录

决策日志是情景记忆的核心载体。它建立决策与结果的映射关系,支持事后复盘与反思学习。

一条典型的投资决策情景记忆结构如下:

# 情景记忆示例
episode_id: EP_2024_08_15_001
timestamp: 2024-08-15T14:30:00+08:00
participants: [客户张先生, 投资顾问智能体]
market_context:
  regime: 牛市末期
  signals: [科技股当日涨8%, 成交量放大150%, 市场情绪亢奋]

narrative:
  trigger: 客户要求以市价买入某科技股
  analysis:
    - 识别风险:股价短期涨幅过大,追高风险高
    - 历史参照:类似情况下次日回调概率 65%
    - 备选方案:[市价买入, 分批建仓, 等待回调]
  decision: 建议客户等待回调,分三批建仓

outcome:
  result: 客户采纳建议
  metrics:
    - 次日股价回调 3%
    - 分三批建仓完成
    - 平均成本比市价买入降低 2.5%

reflection:
  pattern: 短期急涨 + 情绪亢奋 → 高概率回调
  strategy_validated: 分批建仓在追涨场景有效
  applicable_conditions: 适用于非趋势性的短期急涨
  lessons: 情绪指标是追高场景的关键预警信号

这种结构化的记录方式,让智能体能够:

  • 回顾决策的完整逻辑链条
  • 验证策略的实际效果
  • 提炼可复用的经验模式
提示设计技巧

决策日志应该记录”为什么”而不仅仅是”做了什么”。记录”在市场过热信号下建议减仓科技股”比单纯记录”减仓科技股 10%“更有学习价值。

市场情境标签是情景记忆的重要组成部分。通过标记当时的市场状态(牛市、熊市、盘整、危机),智能体可以在未来回答”相似情境下什么策略有效”这类问题。

情境标签 典型特征 历史案例
牛市 指数持续上涨,情绪乐观 2019-2021 科技股行情
熊市 指数持续下跌,恐慌情绪 2022 年加息周期
盘整 窄幅震荡,方向不明 2024 Q2 市场
危机 急跌、流动性紧张 2020 年 3 月新冠冲击

6.5.3 元认知模式与认知演化

情景记忆的更高级应用是支持智能体的元认知能力——不仅记住做了什么,还要理解自己是如何思考问题的。

从知识积累到思维方式

人类学习新领域时,获得的不只是知识累积,更是认知方式的转变。学习 Angrist 的计量经济学方法后,你看问题的方式会改变:

学习前 学习后
看到相关性就下结论 先问因果识别策略是什么
相信模型预测 追问理想实验是什么样的
追求一般性证明 承认 LATE 的局部性

这些不是具体知识,而是可迁移的认知工具。智能体也应该记录和积累这类元认知模式。

认知演化的三个层次

层次 1:记住事实和数据

层次 2:记住推理模式和判断框架

层次 3:记住「什么时候用什么思考方式」
注记知识卡片:元认知

元认知(Metacognition)是对自己思维过程的觉察和调控。一个具有元认知能力的智能体,不仅能分析问题,还能反思自己的分析方法是否恰当。

在记忆架构设计中,可以将元认知模式作为独立层级存在:

Layer 0: 基础模型能力

Layer 1: 核心身份(价值观、决策风格)

Layer 1.5: 元认知模式 [关键层]
         - 问题处理框架
         - 评估想法的通用流程
         - 变化频率:每学习一个新领域后

Layer 2: 领域知识

Layer 3: 会话上下文

Layer 1.5 存储的是思维模式,而非具体知识。这些模式一旦习得,可以迁移应用到新的领域。

金融场景的元认知模式示例

## 元认知模式:估值分析框架

### 触发条件
当需要评估一家公司是否被高估或低估时

### 思考步骤
1. 首先确定估值基准(行业平均、历史均值、可比公司)
2. 选择合适的估值指标(PE、PB、PS、EV/EBITDA)
3. 分析估值差异的原因(增长预期、风险溢价、流动性)
4. 判断估值差异是否合理

### 常见陷阱
- 忽略行业差异,直接横向比较
- 使用单一指标下结论
- 混淆市值与企业价值

### 来源
2024 年分析 50 家科技公司后总结

6.5.4 经验迁移与类比推理

情景记忆的一个重要应用是支持类比推理。当智能体面对新的市场情境时,可以检索历史上的相似情况,借鉴过往经验。

注记知识卡片:历史类比法

投资领域有一句名言:历史不会重演,但会押韵。2022-2023 年的美联储加息周期与 1994-1995 年有诸多相似之处,了解历史能帮助我们更好地应对当下。

市场情景回顾

当前市场出现美联储暂停加息、经济软着陆信号、科技股低估值的组合时,智能体可以检索 1995-1996 年的类似情况,分析当时市场的后续走势。

客户行为模式

首次经历熊市的投资者往往高估自己的风险承受能力。智能体记录客户在市场下跌时的真实反应(频繁查看账户、焦虑情绪、考虑赎回),用于校正风险画像。

跨智能体经验迁移

在多智能体系统中,情景记忆支持追踪哪个智能体做了什么决策。研究智能体的分析经验可以迁移给执行智能体,避免重复劳动。