跳到主要内容

FinBayes 金融认知体系研究专题 — 工作流复盘

工作流定位

把 ADR-007 working 骨架(6 机制 + 4 类业内零件 + 5 种迭代方法候选)推进到 金融认知体系第一版正式构成,产出 ADR-007 supplement 作为正式锚定,同时对 meta-playbook v1.1 在「跨层级 × 起草」专题场景的适配做实战检验。本工作流是 FinBayes v3 战略白皮书工作流(已 stable)的承接专题,定位为 L1 战略层与 L3 架构层之间的「机制内容层」研究。

1. 工作流全程量化指标

维度数据
启动 → formalize 节奏Phase 0 → Phase 7 收尾在同日完成(2026-05-28,密集推进)
总 Phase 数9 个(Phase 0 启动 / Phase 1 学界对照 / Phase 1.5 Prep 补料 / Phase 2 案例反向校准 / Phase 3 机制清单起草 / Phase 4 评测体系 / Phase 5 迭代治理 / Phase 6 多 Agent review + R1 修订 + R2 mini-review / Phase 7 formalize / Phase 8 案例库雏形 / Phase 9 复盘)
总产出文件数42 份(drafts 27 + reviews 11 + decisions 1 + README + status + retrospective)
总产出字数约 64 万字(含中英文混合字符)
总产出行数约 5646 行
反向校准 case 总数18 个(10 全球 + 4 A 股初批 + 4 EM 补充批)
锁定机制层8 机制 + MCA 7 分轴 + S1 横切子流程 + 11 评测维度 + 7 MCA 评测桶
sub-agent 调度次数约 25-30 次(含 Phase 1 单 agent / Phase 1.5 三 prep agent 并行 / Phase 2 三批共 14 + 4 case agent / Phase 3 T1-T5 五 agent 并行 / Phase 4-5 各 1 agent / Phase 6 三 reviewer 并行 + R1 五修订 agent 并行 + R2 mini-review agent)
各 Phase 工作量分布Phase 1 + 1.5 准备约 15% / Phase 2 反向校准约 30% / Phase 3 起草约 20% / Phase 4-5 评测治理约 10% / Phase 6 review + R1 修订约 20% / Phase 7 formalize 约 5%
显式留 pending 项6 项学界不确定性 + 4 项 C 级证据 + 13 项 R1 未触及项 + M5.9 / D8-D11 case 激活 / S19 / 峰终扭曲 等

2. 工作流方法论评估

2.1 meta-playbook v1.1 已验证有效的范式

范式 1(工作流外化):v3 战略白皮书工作流之后第二个独立外化的承接工作流。governance/workstreams/finbayes-cognition-system-research/ 目录骨架(README / status / drafts / reviews / decisions)完整复用,仅在 drafts 内按 Phase 子前缀(phase2-case-* / phase3-* / phase4-* / phase5-* / phase7-*)做层次切分。验证:跨 Phase 文件数 ≥ 30 时,目录骨架对 Agent 可寻址性是充分的。

范式 3(多 Agent review):完整闭环验证。Phase 6 三 reviewer 并行(R-A 金融专家 / R-B 工程实施 / R-C 评测视角)→ R1 综合裁决(14 条 🔴 + ~20% 工程子机制 🔴 + 8 项评测硬缺陷的合并优先级裁决)→ R1 修订 5 项并行 sub-agent → R2 mini-review 自检收口。此为 v1.1 范式 3 的第一个三段式 review-修订-自检完整实例。

范式 5(写作纪律):禁词清单沿用 v3 工作流。Phase 3 T5 mini-review 对 T1-T4 四份 ≥ 5000 字主稿做了 grep 实测验证,0 命中。验证:禁词清单在多 sub-agent 并行起草场景下仍可强制执行,但需要在 review 阶段补一次 grep 兜底。

范式 9(多 sub-agent 并行调度):本工作流是 v1.1 范式 9 的极致压测。Phase 1.5 Prep 三 agent / Phase 2 三批共 14 + 4 case agent / Phase 3 T1-T5 五 agent / Phase 6 三 reviewer / Phase 6 R1 五修订 agent。peak 同时 5-7 sub-agent 在跑。验证:sub-agent 简报 ≤ 800 字约束在 case-by-case 反向校准场景下需放宽到 ≤ 2000 字(单 case 产出 60-130 行),但综合 brief 仍需 ≤ 800 字纪律。

范式 6(Stage Gate Dashboard)+ 范式 8(立场降级 Audit Trail ADR):本工作流虽未直接降级既有立场,但「保持 8 机制不锁死」「pending 项保持显式登记」「冷藏判定加非样本不足兜底」三处沿用同一 audit trail 范式。

2.2 候选 meta-playbook v1.2 新范式(本工作流首次实践)

新范式 10:多批 case 反向校准 + 中期评估迭代。Phase 2 把 14 case 拆三批推进(第一批 3 case + 中期评估 → 第二批 7 case + 二次评估 → 第三批 4 case + 最终综合),每批之间显式做一次"是否需要调整 8 机制再启下一批"的中期判定。第一批 3 case 后已能预判 S1 / S2 两个调整候选,避免 14 case 全跑完再返工。比"一口气 14 case"的方案节省约 30% 返工风险。

新范式 11:横切层 + 子机制 + 共享分轴 三种结构扩展路径。当某新洞察可能成为「第 9 机制」时,先尝试三种装回路径:(a) 横切层(S1 跨 M5+M6+M7 评估子流程)/ (b) 子机制(M5.3 shared-book / M5.8 相关性跃迁 / M3.t8 Koo / M3.t9 Minsky)/ (c) 共享分轴(MCA 7 轴是 M1-M7 共享输入参数)。Phase 2 综合阶段以 3:1 否决「M9 叙事-数字一致性新增机制」提案,改走 S1 横切层路径。此范式让体系扩展默认偏向"装回原型",对抗 LLM 起草天然的"为新现象起新机制"膨胀偏好。

新范式 12:R1 修订 + R2 mini-review 三段式闭环。v1.1 范式 3 只提到 R1 + 简化 R2 两轮。本工作流在 R1 综合裁决后单独跑了 5 项并行修订 sub-agent,再用一个独立 mini-review sub-agent 做收口自检。三段式(R-A/R-B/R-C 并行 → R1 综合 + 5 修订并行 → R2 mini-review 收口)比"R1 + R2"两段式多承载了"修订证据链可追溯"的责任。R2 mini-review 报告里每条 R-A 🔴 都映射到 R1 P0/P1 编号 + 落位文件 + 收口状态(✅ / 🟡 / 🔴),让外部审计可追溯。

新范式 13:三阶证据组合(学界对照 → 案例校准 → 学术框架落位)。Phase 1(学界 / 业内方法论对照)+ Phase 2(18 case 反向校准)+ Phase 1.5 Prep-2(学术框架落位预判)三阶并行而非串行。学界覆盖度判定与 case 实证证据形成正交证据集,最终在 Phase 3 起草时三源汇合。比单纯案例驱动或单纯学界驱动都更稳健——单源驱动易产生"为某 case 起新机制"或"为某学派起新机制"的偏差。

新范式 14:pending 状态管理(schema 已立 + 等 case 激活)。M5.9 Mundell-Fleming 三难 / D8-D11 四维 / C 级证据(S3 / S6 / S19 / 峰终)/ 6 项学界不确定性 / R1 未触及 13 项,全部以「pending 占位 + 触发条件 + 升降级门槛」形式显式登记,而非"等需要时再补"。supplement §5.2 把 pending 项分四类:🟢 学界不确定 / C 级证据 / R1 未触及 / 工程依赖。验证:pending 显式登记比"留白不说"更利于跨工作流接力(Mundell-Fleming case 扩充任务可以直接被 90 天 Phase 7+ 路径捕获)。

新范式 15:半人工标注 + 公开数据替代 v1 工程回退。Phase 7-C SLA。当 sub-agent 在工程视角识别出三处「数据不可得 / LLM 工程语义不清 / 阈值需人判」(M5.3 (c)(d) / M7.meta / MCA 轴 4 N3)时,R1 P0-4 给出统一"v1 半人工 + 公开数据替代 + 24 小时 SLA + v2 数据通路扩展后自动化"四步回退路径。比"留作 TODO"或"删除"更可执行。

新范式 16:inbox proposal 跨工作流接口。Phase 7 不试图自己改架构层 ADR-008,而是产出一份 governance/proposals/inbox/2026-05-28--finbayes-cognition-mechanism-output-extension-to-adr008.mdfinbayes-arch-rewrite 工作流发起 ADR-008 supplement 起草请求。本工作流仅锁定行为契约(5 字段 + 1 元数据语义 + 触发条件 + 反向耦合),实现细节(Pydantic schema / 求解顺序 / 字段命名最终态)交给架构工作流。范式:跨层级承接工作流要显式定义"自己锁定什么 / 留给谁锁定什么"的边界,不越权改下游 ADR。

2.3 不顺利 / 需要在 meta-playbook 中显式预警的反模式

预警 1:多 sub-agent 并行的命名空间冲突。Phase 2 第一批与第二批不同 case agent 都用了 S18 命名独立信号;R1 修订时 R-A / R-B / R-C 同时引用「P0-1 #5」「P0-2」「P0-3」编号但各自含义不完全对齐。整个工作流出现多处「同名信号不同义」/「同号不同集」。预警:sub-agent 并行起草需要在任务包里显式给出"已用命名空间清单",并要求新增标识符必须 grep 一次现有 ID 池。

预警 2:本地路径泄露。Phase 6 R-A / R-B / R-C 多份 reviewer 产出 + R1 五修订 agent 产出均出现过本地用户主目录绝对路径(虽然在落盘前已清理),原因是 sub-agent 在工作目录寻址时 LLM 倾向输出"为方便用户跳转"的本地路径。预警:任务包必须显式列出"输出禁出现本地路径 / 私有工程仓路径",并在 verify-kb / mini-review 阶段强制 grep。建议在 meta-playbook §5 范式 5 写作纪律里追加"自动 grep 本地路径 + 禁词清单"工具建议。

预警 3:researcher vs general-purpose sub-agent 类型的 Write 权限差异。Phase 2 / Phase 3 / Phase 6 多次出现 researcher 类型 sub-agent 无 Write 权限只能输出 simbrief,主会话需要二次落盘;general-purpose 类型可直接 Write 但调度成本更高。预警:在工作流外化目录骨架阶段就应该显式给出"哪些产出由 sub-agent 直接落盘 / 哪些由主会话承接落盘"的责任分工。

预警 4:R1 修订 sub-agent 的相互依赖处理。Phase 6 R1 五修订 agent 并行:T1(8 机制全修)/ 评测全修 / MCA+S1+治理 / 14 case 扩 4 个 / 架构 ADR inbox proposal。其中 T1 8 机制升级与 14 case 扩 4 个相互引用(M5.9 占位 vs 4 补充 EM case 激活)/ MCA 轴 7 立项 vs T1 M5 接入。并行启动时三方各自看不到对方最新产出,最终 R2 mini-review 阶段需要做大量"接口对齐"检查。预警:并行 sub-agent 起草存在相互依赖时,meta-playbook 应给出"依赖矩阵 + 锚点先落盘 + 互引位置标 cross-ref"模板。

预警 5:「证据强度差距」与「pending 门槛」的张力。R-A P0-1 中 Mundell-Fleming 与 MM 资本结构同列必修,但前者只能"占位 + 等 case 激活",后者已能直接落位 M6.X。R1 综合裁决统一了优先级却未统一证据深度。如果不显式标记"占位 vs 实落",下游 ADR-008 supplement 起草工作流可能误把 M5.9 当 M6.X 同档处理。本工作流通过 mechanisms §5.5 + supplement §5.2 双重显式登记缓解,但仍是反模式。

3. 与 v3 战略白皮书工作流的对比

维度v3 战略白皮书工作流本工作流(认知体系研究)复用 / 演进
工作量约 18-20 小时 / 1325 行 / 7 ADR同日密集推进 / 5646 行 / 1 supplement ADR体量 4 倍 / 集成度更高
Phase 数10 节连续推进9 + 1.5 Prep 子 phasePrep 补料范式新增
sub-agent 使用方式11 次(业内调研 + 本地仓库 + 架构调研 + R1 + 下游 + cross-check)~25-30 次(含 14 + 4 case agent + T1-T5 起草 + 三 reviewer + 五修订)并行规模 2.5 倍
多 Agent reviewR1(4 reviewer)+ 简化 R2R1(3 reviewer 并行)+ 5 项 R1 修订并行 + R2 mini-review 自检三段式闭环(v1.2 候选范式 12)
用户拉回次数6 次(Stage Gate / 不锁死 / identity 区分 / cross-check / 认知体系不锁死 / 等)显式拉回较少(决议节点:3:1 否决 M9 / 14→18 case 扩充 / R1 修订路径 K1 (a) 选项)用户介入从「频繁拉回」转为「关键决议」,sub-agent 自主性更高
立场处理identity + 当前版本立场区分 + ADR-009 audit trail沿用 ADR-009 范式做 pending 项分级 + 冷藏判定非样本不足兜底范式直接复用
Cross-check 范式v2 → v3 严肃交叉对比识别 10 个 Gap本工作流是 ADR-007 working → 第一版正式构成的"扩展而非重写",cross-check 形态变化(替代为 R2 mini-review 收口判定)范式 7 形态适配为"扩展校验"
案例库形态v3 第四节仅 2 个 case(美联储 / AI 叙事)18 case 反向校准 + 14 项洞察清单 + 7 桶分层case-driven 程度大幅提升
治理机制完整度主要在 ADR-007/008/009 层面Phase 5 治理 8 部分 + 三档门槛 + 防退化 + v1→v2 时间线治理机制颗粒度从 ADR 级深化到 sub-mechanism 级
元产物比例约 40% 元产物 vs 60% 实质约 30% 元产物 vs 70% 实质(18 case 反向校准为主体)case-driven 让元产物比例下降

核心差异:v3 工作流的价值在「用户多次拉回让战略文本在柔性与严谨之间找平衡」,本工作流的价值在「多 sub-agent 并行 + 多批 case 校准 + R1 修订 + R2 自检」的方法论闭环本身。两者互补:v3 是「人主导的方向矫正」,本工作流是「Agent 主导的证据闭环」。

4. meta-playbook v1.1 → v1.2 反馈建议

4.1 推荐入 v1.2 的新范式(5-8 项)

编号候选范式复用条件
范式 10多批 case 反向校准 + 中期评估迭代案例驱动 + 体系级修订决策 ≥ 10 case 时启用
范式 11横切层 + 子机制 + 共享分轴 三种结构扩展路径任何体系级文档「是否新增机制」决策
范式 12R1 修订 + R2 mini-review 三段式闭环review 后存在 ≥ 5 项 P0 修订时启用
范式 13三阶证据组合(学界 → 案例 → 框架落位)体系层 / 认知层 / 方法论层文档起草
范式 14pending 状态管理(schema 已立 + 等 case 激活)任何「持续构建」声明的体系层产出
范式 15半人工标注 + 公开数据替代 v1 工程回退工程不可得 / 数据空白 / 阈值待定的子机制
范式 16inbox proposal 跨工作流接口承接工作流向下游层级提出修订请求时

4.2 已有范式的调整建议

  • 范式 3 多 Agent review 扩展为三段式:v1.1 已支持 R1 内并行下游影响分析,v1.2 进一步把"R1 综合 + 多项 R1 修订并行 + R2 mini-review 自检"标准化为推荐路径。
  • 范式 5 写作纪律新增工具建议:在禁词清单基础上追加"自动 grep 本地路径 + 私有工程仓路径"。建议在工作流外化 README 模板里直接附 npm run verify:kb --only content-hygiene 命令片段。
  • 范式 9 多 sub-agent 并行调度:v1.1 强调每 sub-agent 简报 ≤ 800 字。v1.2 应区分两类:综合 brief ≤ 800 字 / 单 case / 单子机制起草可放宽到 ≤ 2000 字 / 主稿起草不限。

4.3 显式预警 / 反模式(应入 v1.2)

  • 反模式 A 多 sub-agent 命名空间冲突:sub-agent 并行起草需要"已用命名空间清单 + 新增标识符 grep 兜底"。
  • 反模式 B 本地路径泄露:sub-agent 输出禁词应包括本地路径模式(个人主目录正则 / 私有工程仓路径正则)。
  • 反模式 C R1 并行修订的接口对齐缺失:并行修订存在相互引用时需"依赖矩阵 + 锚点先落盘 + cross-ref 标记"模板。
  • 反模式 D 「占位 vs 实落」证据深度未显式区分:当多个 R1 P0 项同优先级但证据深度不同时(如 case 已激活 vs 等 case 激活),必须在 supplement 里显式标记。

4.4 工具建议

  • scripts/verify-kb.mjs--only sub-agent-output-hygiene 子项,扫描 drafts/ 与 reviews/ 内的本地路径 + 禁词 + 命名空间冲突。
  • commons/playbooks/templates/shared/sub-agent-task-packet.md 模板,含"已用命名空间清单 + 输出禁词 + 落盘责任 + 依赖矩阵"四段标准结构。
  • 在 workstream README 模板里加「Phase 间依赖矩阵」表格骨架,让并行 sub-agent 起草时锁定锚点关系。

5. 本工作流自身的不足与遗憾

不足 1:M5.9 Mundell-Fleming 仅占位。R-A §1.1 / §2.7 标为必修,本工作流以"4 补充 EM case 已立 schema、待 case 反向校准 F1 激活"形态收口,但实际未在 18 case 内做 F1 反向校准。L1 1997 亚洲危机 / L2 阿根廷 / L9 欧债 / L13 韩国 IMF 四 case 只跑 schema 锚定(约 60-70 行),未做完整 8 机制反向校准展开。M5.9 子机制定义仅占位一句,无四层(核心定义 + 子机制 + 横切接入 + 输出契约)展开。

不足 2:评测体系仍是公式 v1,未实际跑过 benchmark。Phase 4 11 维度 + 7 MCA 桶 + D7 标答 5 外部独立源 + IAA kappa ≥ 0.7 + 70/20/10 三集划分等规约齐备,但所有指标公式均标"v1 待 Phase 6 R2 校准"。本工作流没有跑任何一次实际评测(无 holdout 实测 / 无桶间百分位实测 / 无 IAA kappa 实测)。Phase 5 治理机制设计了季度全量 + 月度增量节奏,但 T0 v1 落地后才能首次跑评测,本工作流尚未到 T0。

不足 3:Phase 5 治理流程未实际运转过。三档门槛(v2 稳态 5/3/2 case / v1→v2 过渡 4/3/2 case / 子机制 ≥ 3 case)/ 14 天异议期 / 3:1 多数否决 / ADR-009 范式冷藏 + 非样本不足兜底——所有条目仅设计未运转。本工作流通过的唯一一次"3:1 多数否决"是 Phase 2 综合阶段对 M9 新增机制提案的否决,但那是工作流内决议,不是 vN → vN+1 升级判定。

不足 4:18 case 覆盖偏样。10 全球 + 4 A 股 + 4 EM 补充,但 ADR-007 supplement §5.2 已显式列出未充分覆盖的金融场景:固收 / 信用利差 / 衍生品深度市场(除中东 IV 一处外)/ 商品远期曲线 / FX carry trade(除日本一处外)/ 私募与一级市场 / REITs / 跨境并购。case 库偏权益 + 宏观 + 加密,对衍生品 / 信用 / 私募的反向校准证据薄弱。M6.3 衍生品支柱仅 Case 3 中东 IV 单 case 锚定,M6.2 因子支柱仅 Case 6 锂电 + Case A-3 股灾两 case 锚定。

不足 5:R1 未触及 13 项显式留白。Dalio 生产率时钟 / Kahneman 概率权重函数(CPT 第二条腿)/ Shiller 叙事 R0 / Akerlof-Shiller 5 维度后四项 / Greenwald EPV / Modigliani 生命周期 / Fisher 分离定理 / Black-Litterman / 风险平价 / Brunnermeier-Pedersen funding vs market liquidity 双层 / S1 模式 e(叙事-数字时间错位)/ 模式 f(短期 vs 长期不一致)/ D2 内部三类拆分。这 13 项 R-A 在 review 中明确列出但 R1 综合裁决未入 P0 / P1 必修,全部留 Phase 7+。门槛上合理(证据不足),但说明体系第一版完成度未达"金融方法论全谱覆盖"。

不足 6:架构 ADR 起草请求是接口不是闭环。Phase 7 产出的 inbox proposal 仅是请求 finbayes-arch-rewrite 工作流承接 ADR-008 supplement 起草,本工作流不知道架构层何时承接、是否会原样接受 5 字段 + 1 元数据 + correlation_regime 字段建议。如果架构层 review 后推翻部分字段语义,本 supplement 的「行为契约」层需要回修。

不足 7:未做 v3 战略白皮书反向回写。supplement §3 给出与 ADR-007 working 骨架的差异表(6 机制 → 8 机制 + MCA + S1),但没有反向触发 v3 战略白皮书第四节的回写动作。v3 第四节仍按 ADR-007 working 骨架行文,下游引用者可能仍按 6 机制做对接。

6. 后续推进路径

6.1 90 天内(Phase 7+ 路径)

  • Mundell-Fleming 实证激活:4 补充 EM case(L1 / L2 / L9 / L13)做完整 8 机制反向校准(每 case 60-130 行),激活 M5.9 子机制四层定义。
  • D8-D11 case 扩充:D9 跨市场对照推理必须跨 ≥ 2 MCA 桶(补 2-4 跨境同主题 case,如 A-4 + Case 5 AI 美股 vs A 股);D10 数据可靠性需 ≥ 5 事后被证实造假 case + ≥ 15 健康对照(瑞幸 / Wirecard / 康美 / Enron 等历史 case 补入);D11 待 M6.2.x 协方差子机制落地后扩 B4-B7 桶。
  • 半人工标注 SLA 落地:M5.3 (c)(d) / MCA 轴 4 N3 / M7.meta-v1 的 reviewer 工作流 24 小时 SLA 附录写回 Phase 5 治理稿。
  • 架构 ADR-008 supplement 起草:finbayes-arch-rewrite 工作流承接 5 字段 + 1 元数据 + TransmissionGraph correlation_regime 字段。本工作流配合做接口对齐 mini-sync。
  • T4 14 case 摘要表更新:合并 L1 / L2 / L9 / L13 + 新增 MCA 轴 7 触发列 + 修正 L 编号冲突。
  • v3 战略白皮书第四节回写 patch:6 机制 → 8 机制 + MCA + S1 文字更新(走 governance/change-protocol 战略级流程)。

6.2 1 年内(v1 → v2 路径)

  • T0 v1 落地 → T0+1 月首次月度评估 → T0+3 月首次季度全量评估 → T0+6 月 Phase 6+ 启动 → T0+12 月 v1 → v2 升级窗口。
  • v1 → v2 过渡门槛 ≥ 4 case 跨 ≥ 2 桶 + 1 pending 桶证据。具体候选:M5.9 完整激活 / 6 项学界不确定性中至少一项收口 / 评测体系实跑 ≥ 1 季度全量。
  • 13 项 R1 未触及项中至少 5 项纳入 v2(Dalio 生产率时钟 / Black-Litterman / S1 模式 e/f / D2 内部三类拆分等)。

6.3 长期(vN → vN+1 路径)

  • 恢复 ≥ 5 case 跨 ≥ 3 桶稳态门槛。
  • Phase 5 治理流程实际运转(首次 vN → vN+1 升级走完 14 天异议期 + 3:1 多数否决 + ADR-009 audit trail 留痕全流程)。
  • 6 项学界不确定性的跟踪机制(EMH 边界 / DCF vs Multiples 适用性 / 偏差是错误还是适应 / 市场效率时变性 / 凯利公式可用性 / MPT 协方差失稳归因)建立外部学界跟踪小组。
  • 案例库从 18 扩到 100+ case,进入"用户实战反馈 + 业内方法论演进 + 金融市场新场景"三触发源并行运转。

7. 致谢与归档

7.1 各 Phase 主要参与者

  • Phase 1 学界方法论对照:单 sub-agent(task a46d2b1831c2f6a5c)。
  • Phase 1.5 Prep 三 agent 并行:Prep-1 case 标答库 / Prep-2 学术框架落位 / Prep-3 A 股本土因素。
  • Phase 2 反向校准:14 + 4 case agent(每 case 一 agent,三批分推),加批 1 / 批 2 中期评估 agent + 最终综合 agent。
  • Phase 3 五 agent 并行起草:T1 8 机制升级 / T2 MCA / T3 S1 / T4 14 case 摘要 / T5 mini-review。
  • Phase 4-5:评测体系 1 agent + 治理机制 1 agent。
  • Phase 6 三 reviewer 并行:R-A 金融专家 / R-B 工程实施 / R-C 评测视角,加 R1 综合裁决。
  • Phase 6 R1 修订五 agent 并行:T1 8 机制全修 / 评测全修 / MCA+S1+治理 / 14 case 扩 4 个 / 架构 ADR inbox proposal。
  • Phase 6 R2 mini-review:1 agent 做收口自检。
  • Phase 7 formalize:1 agent 主稿落盘 + T4 摘要表更新 + 半人工标注 SLA + 架构 ADR proposal 二次校对。

7.2 关键决策时刻

  1. Phase 1 D1 拍板:6 机制 → 8 机制(拆 M2 信息源 + 拆 M7 行为偏差 + 不确定性量化为独立机制),其余调整后续看 case。
  2. Phase 2 综合阶段 3:1 否决 M9:「叙事-数字一致性」候选机制 3:1 否决,改走 S1 横切子流程路径(首次验证"装回原型"默认偏好)。
  3. 14 case → 18 case 扩充决议:R-A P1-3 提议补 L7 / L2 / L9 / L13 激活 MCA 轴 7 + M5.9 占位,R1 综合裁决接受。
  4. R1 修订路径 K1 选 (a):P0 全修 + P1 全修,约 25-40 小时,sub-agent 并行各项 P0。
  5. 架构 ADR 走 inbox proposal 而非本工作流自起:保持工作流职责边界,不越权改 ADR-008。
  6. R2 mini-review 自检收口而非二次返工:R2 报告 14 条 🔴 → 9 ✅ + 3 🟡 + 2 🔴(留 Phase 7+)通过 formalize。

7.3 归档建议

本 workstream 转 stable。理由:

  • Phase 7 ADR-007 supplement 已 accepted 落盘。
  • Phase 8 案例库雏形通过 18 case 报告 + Prep-1 标答库就位。
  • Phase 9 复盘本身即本文件。
  • 后续推进(Mundell-Fleming case 激活 / D8-D11 case 扩充 / 半人工标注 SLA / 架构 ADR-008 supplement 起草 / v3 战略白皮书回写)均通过 inbox proposal + governance/change-protocol 触发,不需要本 workstream 保持 active 拉锯。
  • 若 1 年后 v1 → v2 升级窗口启动,建议新起 finbayes-cognition-system-v2/ workstream 而非复活本 workstream(避免 audit trail 混淆)。

status / maturity 由 active 改为 stable。本 retrospective 即 stable 转入的收口锚。

关联资产

  • 来源 ADRdecisions/ADR-007-supplement-金融认知体系第一版正式构成.md
  • 5 份 R1 修订主稿:见 supplement §6
  • 18 case 报告:见 drafts/
  • Phase 6 review 全部:见 reviews/
  • 上位工作流governance/workstreams/finbayes-whitepaper-rewrite/(v3,已 stable)
  • 同级 v3 工作流复盘governance/workstreams/finbayes-whitepaper-rewrite/2026-05-28-retrospective.md
  • meta-playbook v1.1commons/playbooks/document-workflows-meta-playbook.md
  • 架构 ADR 起草请求governance/proposals/inbox/2026-05-28--finbayes-cognition-mechanism-output-extension-to-adr008.md