FinBayes 金融认知体系研究专题 — 工作流复盘

工作流定位

把 ADR-007 working 骨架（6 机制 + 4 类业内零件 + 5 种迭代方法候选）推进到 金融认知体系第一版正式构成，产出 ADR-007 supplement 作为正式锚定，同时对 meta-playbook v1.1 在「跨层级 × 起草」专题场景的适配做实战检验。本工作流是 FinBayes v3 战略白皮书工作流（已 stable）的承接专题，定位为 L1 战略层与 L3 架构层之间的「机制内容层」研究。

1. 工作流全程量化指标

维度	数据
启动 → formalize 节奏	Phase 0 → Phase 7 收尾在同日完成（2026-05-28，密集推进）
总 Phase 数	9 个（Phase 0 启动 / Phase 1 学界对照 / Phase 1.5 Prep 补料 / Phase 2 案例反向校准 / Phase 3 机制清单起草 / Phase 4 评测体系 / Phase 5 迭代治理 / Phase 6 多 Agent review + R1 修订 + R2 mini-review / Phase 7 formalize / Phase 8 案例库雏形 / Phase 9 复盘）
总产出文件数	42 份（drafts 27 + reviews 11 + decisions 1 + README + status + retrospective）
总产出字数	约 64 万字（含中英文混合字符）
总产出行数	约 5646 行
反向校准 case 总数	18 个（10 全球 + 4 A 股初批 + 4 EM 补充批）
锁定机制层	8 机制 + MCA 7 分轴 + S1 横切子流程 + 11 评测维度 + 7 MCA 评测桶
sub-agent 调度次数	约 25-30 次（含 Phase 1 单 agent / Phase 1.5 三 prep agent 并行 / Phase 2 三批共 14 + 4 case agent / Phase 3 T1-T5 五 agent 并行 / Phase 4-5 各 1 agent / Phase 6 三 reviewer 并行 + R1 五修订 agent 并行 + R2 mini-review agent）
各 Phase 工作量分布	Phase 1 + 1.5 准备约 15% / Phase 2 反向校准约 30% / Phase 3 起草约 20% / Phase 4-5 评测治理约 10% / Phase 6 review + R1 修订约 20% / Phase 7 formalize 约 5%
显式留 pending 项	6 项学界不确定性 + 4 项 C 级证据 + 13 项 R1 未触及项 + M5.9 / D8-D11 case 激活 / S19 / 峰终扭曲等

2. 工作流方法论评估

2.1 meta-playbook v1.1 已验证有效的范式

范式 1（工作流外化）：v3 战略白皮书工作流之后第二个独立外化的承接工作流。governance/workstreams/finbayes-cognition-system-research/ 目录骨架（README / status / drafts / reviews / decisions）完整复用，仅在 drafts 内按 Phase 子前缀（phase2-case-* / phase3-* / phase4-* / phase5-* / phase7-*）做层次切分。验证：跨 Phase 文件数 ≥ 30 时，目录骨架对 Agent 可寻址性是充分的。

范式 3（多 Agent review）：完整闭环验证。Phase 6 三 reviewer 并行（R-A 金融专家 / R-B 工程实施 / R-C 评测视角）→ R1 综合裁决（14 条 🔴 + ~20% 工程子机制 🔴 + 8 项评测硬缺陷的合并优先级裁决）→ R1 修订 5 项并行 sub-agent → R2 mini-review 自检收口。此为 v1.1 范式 3 的第一个三段式 review-修订-自检完整实例。

范式 5（写作纪律）：禁词清单沿用 v3 工作流。Phase 3 T5 mini-review 对 T1-T4 四份 ≥ 5000 字主稿做了 grep 实测验证，0 命中。验证：禁词清单在多 sub-agent 并行起草场景下仍可强制执行，但需要在 review 阶段补一次 grep 兜底。

范式 9（多 sub-agent 并行调度）：本工作流是 v1.1 范式 9 的极致压测。Phase 1.5 Prep 三 agent / Phase 2 三批共 14 + 4 case agent / Phase 3 T1-T5 五 agent / Phase 6 三 reviewer / Phase 6 R1 五修订 agent。peak 同时 5-7 sub-agent 在跑。验证：sub-agent 简报 ≤ 800 字约束在 case-by-case 反向校准场景下需放宽到 ≤ 2000 字（单 case 产出 60-130 行），但综合 brief 仍需 ≤ 800 字纪律。

范式 6（Stage Gate Dashboard）+ 范式 8（立场降级 Audit Trail ADR）：本工作流虽未直接降级既有立场，但「保持 8 机制不锁死」「pending 项保持显式登记」「冷藏判定加非样本不足兜底」三处沿用同一 audit trail 范式。

2.2 候选 meta-playbook v1.2 新范式（本工作流首次实践）

新范式 10：多批 case 反向校准 + 中期评估迭代。Phase 2 把 14 case 拆三批推进（第一批 3 case + 中期评估 → 第二批 7 case + 二次评估 → 第三批 4 case + 最终综合），每批之间显式做一次"是否需要调整 8 机制再启下一批"的中期判定。第一批 3 case 后已能预判 S1 / S2 两个调整候选，避免 14 case 全跑完再返工。比"一口气 14 case"的方案节省约 30% 返工风险。

新范式 11：横切层 + 子机制 + 共享分轴三种结构扩展路径。当某新洞察可能成为「第 9 机制」时，先尝试三种装回路径：(a) 横切层（S1 跨 M5+M6+M7 评估子流程）/ (b) 子机制（M5.3 shared-book / M5.8 相关性跃迁 / M3.t8 Koo / M3.t9 Minsky）/ (c) 共享分轴（MCA 7 轴是 M1-M7 共享输入参数）。Phase 2 综合阶段以 3:1 否决「M9 叙事-数字一致性新增机制」提案，改走 S1 横切层路径。此范式让体系扩展默认偏向"装回原型"，对抗 LLM 起草天然的"为新现象起新机制"膨胀偏好。

新范式 12：R1 修订 + R2 mini-review 三段式闭环。v1.1 范式 3 只提到 R1 + 简化 R2 两轮。本工作流在 R1 综合裁决后单独跑了 5 项并行修订 sub-agent，再用一个独立 mini-review sub-agent 做收口自检。三段式（R-A/R-B/R-C 并行 → R1 综合 + 5 修订并行 → R2 mini-review 收口）比"R1 + R2"两段式多承载了"修订证据链可追溯"的责任。R2 mini-review 报告里每条 R-A 🔴 都映射到 R1 P0/P1 编号 + 落位文件 + 收口状态（✅ / 🟡 / 🔴），让外部审计可追溯。

新范式 13：三阶证据组合（学界对照 → 案例校准 → 学术框架落位）。Phase 1（学界 / 业内方法论对照）+ Phase 2（18 case 反向校准）+ Phase 1.5 Prep-2（学术框架落位预判）三阶并行而非串行。学界覆盖度判定与 case 实证证据形成正交证据集，最终在 Phase 3 起草时三源汇合。比单纯案例驱动或单纯学界驱动都更稳健——单源驱动易产生"为某 case 起新机制"或"为某学派起新机制"的偏差。

新范式 14：pending 状态管理（schema 已立 + 等 case 激活）。M5.9 Mundell-Fleming 三难 / D8-D11 四维 / C 级证据（S3 / S6 / S19 / 峰终）/ 6 项学界不确定性 / R1 未触及 13 项，全部以「pending 占位 + 触发条件 + 升降级门槛」形式显式登记，而非"等需要时再补"。supplement §5.2 把 pending 项分四类：🟢 学界不确定 / C 级证据 / R1 未触及 / 工程依赖。验证：pending 显式登记比"留白不说"更利于跨工作流接力（Mundell-Fleming case 扩充任务可以直接被 90 天 Phase 7+ 路径捕获）。

新范式 15：半人工标注 + 公开数据替代 v1 工程回退。Phase 7-C SLA。当 sub-agent 在工程视角识别出三处「数据不可得 / LLM 工程语义不清 / 阈值需人判」（M5.3 (c)(d) / M7.meta / MCA 轴 4 N3）时，R1 P0-4 给出统一"v1 半人工 + 公开数据替代 + 24 小时 SLA + v2 数据通路扩展后自动化"四步回退路径。比"留作 TODO"或"删除"更可执行。

新范式 16：inbox proposal 跨工作流接口。Phase 7 不试图自己改架构层 ADR-008，而是产出一份 governance/proposals/inbox/2026-05-28--finbayes-cognition-mechanism-output-extension-to-adr008.md 向 finbayes-arch-rewrite 工作流发起 ADR-008 supplement 起草请求。本工作流仅锁定行为契约（5 字段 + 1 元数据语义 + 触发条件 + 反向耦合），实现细节（Pydantic schema / 求解顺序 / 字段命名最终态）交给架构工作流。范式：跨层级承接工作流要显式定义"自己锁定什么 / 留给谁锁定什么"的边界，不越权改下游 ADR。

2.3 不顺利 / 需要在 meta-playbook 中显式预警的反模式

预警 1：多 sub-agent 并行的命名空间冲突。Phase 2 第一批与第二批不同 case agent 都用了 S18 命名独立信号；R1 修订时 R-A / R-B / R-C 同时引用「P0-1 #5」「P0-2」「P0-3」编号但各自含义不完全对齐。整个工作流出现多处「同名信号不同义」/「同号不同集」。预警：sub-agent 并行起草需要在任务包里显式给出"已用命名空间清单"，并要求新增标识符必须 grep 一次现有 ID 池。

预警 2：本地路径泄露。Phase 6 R-A / R-B / R-C 多份 reviewer 产出 + R1 五修订 agent 产出均出现过本地用户主目录绝对路径（虽然在落盘前已清理），原因是 sub-agent 在工作目录寻址时 LLM 倾向输出"为方便用户跳转"的本地路径。预警：任务包必须显式列出"输出禁出现本地路径 / 私有工程仓路径"，并在 verify-kb / mini-review 阶段强制 grep。建议在 meta-playbook §5 范式 5 写作纪律里追加"自动 grep 本地路径 + 禁词清单"工具建议。

预警 3：researcher vs general-purpose sub-agent 类型的 Write 权限差异。Phase 2 / Phase 3 / Phase 6 多次出现 researcher 类型 sub-agent 无 Write 权限只能输出 simbrief，主会话需要二次落盘；general-purpose 类型可直接 Write 但调度成本更高。预警：在工作流外化目录骨架阶段就应该显式给出"哪些产出由 sub-agent 直接落盘 / 哪些由主会话承接落盘"的责任分工。

预警 4：R1 修订 sub-agent 的相互依赖处理。Phase 6 R1 五修订 agent 并行：T1（8 机制全修）/ 评测全修 / MCA+S1+治理 / 14 case 扩 4 个 / 架构 ADR inbox proposal。其中 T1 8 机制升级与 14 case 扩 4 个相互引用（M5.9 占位 vs 4 补充 EM case 激活）/ MCA 轴 7 立项 vs T1 M5 接入。并行启动时三方各自看不到对方最新产出，最终 R2 mini-review 阶段需要做大量"接口对齐"检查。预警：并行 sub-agent 起草存在相互依赖时，meta-playbook 应给出"依赖矩阵 + 锚点先落盘 + 互引位置标 cross-ref"模板。

预警 5：「证据强度差距」与「pending 门槛」的张力。R-A P0-1 中 Mundell-Fleming 与 MM 资本结构同列必修，但前者只能"占位 + 等 case 激活"，后者已能直接落位 M6.X。R1 综合裁决统一了优先级却未统一证据深度。如果不显式标记"占位 vs 实落"，下游 ADR-008 supplement 起草工作流可能误把 M5.9 当 M6.X 同档处理。本工作流通过 mechanisms §5.5 + supplement §5.2 双重显式登记缓解，但仍是反模式。

3. 与 v3 战略白皮书工作流的对比

维度	v3 战略白皮书工作流	本工作流（认知体系研究）	复用 / 演进
工作量	约 18-20 小时 / 1325 行 / 7 ADR	同日密集推进 / 5646 行 / 1 supplement ADR	体量 4 倍 / 集成度更高
Phase 数	10 节连续推进	9 + 1.5 Prep 子 phase	Prep 补料范式新增
sub-agent 使用方式	11 次（业内调研 + 本地仓库 + 架构调研 + R1 + 下游 + cross-check）	~25-30 次（含 14 + 4 case agent + T1-T5 起草 + 三 reviewer + 五修订）	并行规模 2.5 倍
多 Agent review	R1（4 reviewer）+ 简化 R2	R1（3 reviewer 并行）+ 5 项 R1 修订并行 + R2 mini-review 自检	三段式闭环（v1.2 候选范式 12）
用户拉回次数	6 次（Stage Gate / 不锁死 / identity 区分 / cross-check / 认知体系不锁死 / 等）	显式拉回较少（决议节点：3:1 否决 M9 / 14→18 case 扩充 / R1 修订路径 K1 (a) 选项）	用户介入从「频繁拉回」转为「关键决议」，sub-agent 自主性更高
立场处理	identity + 当前版本立场区分 + ADR-009 audit trail	沿用 ADR-009 范式做 pending 项分级 + 冷藏判定非样本不足兜底	范式直接复用
Cross-check 范式	v2 → v3 严肃交叉对比识别 10 个 Gap	本工作流是 ADR-007 working → 第一版正式构成的"扩展而非重写"，cross-check 形态变化（替代为 R2 mini-review 收口判定）	范式 7 形态适配为"扩展校验"
案例库形态	v3 第四节仅 2 个 case（美联储 / AI 叙事）	18 case 反向校准 + 14 项洞察清单 + 7 桶分层	case-driven 程度大幅提升
治理机制完整度	主要在 ADR-007/008/009 层面	Phase 5 治理 8 部分 + 三档门槛 + 防退化 + v1→v2 时间线	治理机制颗粒度从 ADR 级深化到 sub-mechanism 级
元产物比例	约 40% 元产物 vs 60% 实质	约 30% 元产物 vs 70% 实质（18 case 反向校准为主体）	case-driven 让元产物比例下降

核心差异：v3 工作流的价值在「用户多次拉回让战略文本在柔性与严谨之间找平衡」，本工作流的价值在「多 sub-agent 并行 + 多批 case 校准 + R1 修订 + R2 自检」的方法论闭环本身。两者互补：v3 是「人主导的方向矫正」，本工作流是「Agent 主导的证据闭环」。

4. meta-playbook v1.1 → v1.2 反馈建议

4.1 推荐入 v1.2 的新范式（5-8 项）

编号	候选范式	复用条件
范式 10	多批 case 反向校准 + 中期评估迭代	案例驱动 + 体系级修订决策 ≥ 10 case 时启用
范式 11	横切层 + 子机制 + 共享分轴三种结构扩展路径	任何体系级文档「是否新增机制」决策
范式 12	R1 修订 + R2 mini-review 三段式闭环	review 后存在 ≥ 5 项 P0 修订时启用
范式 13	三阶证据组合（学界 → 案例 → 框架落位）	体系层 / 认知层 / 方法论层文档起草
范式 14	pending 状态管理（schema 已立 + 等 case 激活）	任何「持续构建」声明的体系层产出
范式 15	半人工标注 + 公开数据替代 v1 工程回退	工程不可得 / 数据空白 / 阈值待定的子机制
范式 16	inbox proposal 跨工作流接口	承接工作流向下游层级提出修订请求时

4.2 已有范式的调整建议

范式 3 多 Agent review 扩展为三段式：v1.1 已支持 R1 内并行下游影响分析，v1.2 进一步把"R1 综合 + 多项 R1 修订并行 + R2 mini-review 自检"标准化为推荐路径。
范式 5 写作纪律新增工具建议：在禁词清单基础上追加"自动 grep 本地路径 + 私有工程仓路径"。建议在工作流外化 README 模板里直接附 npm run verify:kb --only content-hygiene 命令片段。
范式 9 多 sub-agent 并行调度：v1.1 强调每 sub-agent 简报 ≤ 800 字。v1.2 应区分两类：综合 brief ≤ 800 字 / 单 case / 单子机制起草可放宽到 ≤ 2000 字 / 主稿起草不限。

4.3 显式预警 / 反模式（应入 v1.2）

反模式 A 多 sub-agent 命名空间冲突：sub-agent 并行起草需要"已用命名空间清单 + 新增标识符 grep 兜底"。
反模式 B 本地路径泄露：sub-agent 输出禁词应包括本地路径模式（个人主目录正则 / 私有工程仓路径正则）。
反模式 C R1 并行修订的接口对齐缺失：并行修订存在相互引用时需"依赖矩阵 + 锚点先落盘 + cross-ref 标记"模板。
反模式 D 「占位 vs 实落」证据深度未显式区分：当多个 R1 P0 项同优先级但证据深度不同时（如 case 已激活 vs 等 case 激活），必须在 supplement 里显式标记。

4.4 工具建议

在 scripts/verify-kb.mjs 加 --only sub-agent-output-hygiene 子项，扫描 drafts/ 与 reviews/ 内的本地路径 + 禁词 + 命名空间冲突。
在 commons/playbooks/templates/shared/ 起 sub-agent-task-packet.md 模板，含"已用命名空间清单 + 输出禁词 + 落盘责任 + 依赖矩阵"四段标准结构。
在 workstream README 模板里加「Phase 间依赖矩阵」表格骨架，让并行 sub-agent 起草时锁定锚点关系。

5. 本工作流自身的不足与遗憾

不足 1：M5.9 Mundell-Fleming 仅占位。R-A §1.1 / §2.7 标为必修，本工作流以"4 补充 EM case 已立 schema、待 case 反向校准 F1 激活"形态收口，但实际未在 18 case 内做 F1 反向校准。L1 1997 亚洲危机 / L2 阿根廷 / L9 欧债 / L13 韩国 IMF 四 case 只跑 schema 锚定（约 60-70 行），未做完整 8 机制反向校准展开。M5.9 子机制定义仅占位一句，无四层（核心定义 + 子机制 + 横切接入 + 输出契约）展开。

不足 2：评测体系仍是公式 v1，未实际跑过 benchmark。Phase 4 11 维度 + 7 MCA 桶 + D7 标答 5 外部独立源 + IAA kappa ≥ 0.7 + 70/20/10 三集划分等规约齐备，但所有指标公式均标"v1 待 Phase 6 R2 校准"。本工作流没有跑任何一次实际评测（无 holdout 实测 / 无桶间百分位实测 / 无 IAA kappa 实测）。Phase 5 治理机制设计了季度全量 + 月度增量节奏，但 T0 v1 落地后才能首次跑评测，本工作流尚未到 T0。

不足 3：Phase 5 治理流程未实际运转过。三档门槛（v2 稳态 5/3/2 case / v1→v2 过渡 4/3/2 case / 子机制 ≥ 3 case）/ 14 天异议期 / 3:1 多数否决 / ADR-009 范式冷藏 + 非样本不足兜底——所有条目仅设计未运转。本工作流通过的唯一一次"3:1 多数否决"是 Phase 2 综合阶段对 M9 新增机制提案的否决，但那是工作流内决议，不是 vN → vN+1 升级判定。

不足 4：18 case 覆盖偏样。10 全球 + 4 A 股 + 4 EM 补充，但 ADR-007 supplement §5.2 已显式列出未充分覆盖的金融场景：固收 / 信用利差 / 衍生品深度市场（除中东 IV 一处外）/ 商品远期曲线 / FX carry trade（除日本一处外）/ 私募与一级市场 / REITs / 跨境并购。case 库偏权益 + 宏观 + 加密，对衍生品 / 信用 / 私募的反向校准证据薄弱。M6.3 衍生品支柱仅 Case 3 中东 IV 单 case 锚定，M6.2 因子支柱仅 Case 6 锂电 + Case A-3 股灾两 case 锚定。

不足 5：R1 未触及 13 项显式留白。Dalio 生产率时钟 / Kahneman 概率权重函数（CPT 第二条腿）/ Shiller 叙事 R0 / Akerlof-Shiller 5 维度后四项 / Greenwald EPV / Modigliani 生命周期 / Fisher 分离定理 / Black-Litterman / 风险平价 / Brunnermeier-Pedersen funding vs market liquidity 双层 / S1 模式 e（叙事-数字时间错位）/ 模式 f（短期 vs 长期不一致）/ D2 内部三类拆分。这 13 项 R-A 在 review 中明确列出但 R1 综合裁决未入 P0 / P1 必修，全部留 Phase 7+。门槛上合理（证据不足），但说明体系第一版完成度未达"金融方法论全谱覆盖"。

不足 6：架构 ADR 起草请求是接口不是闭环。Phase 7 产出的 inbox proposal 仅是请求 finbayes-arch-rewrite 工作流承接 ADR-008 supplement 起草，本工作流不知道架构层何时承接、是否会原样接受 5 字段 + 1 元数据 + correlation_regime 字段建议。如果架构层 review 后推翻部分字段语义，本 supplement 的「行为契约」层需要回修。

不足 7：未做 v3 战略白皮书反向回写。supplement §3 给出与 ADR-007 working 骨架的差异表（6 机制 → 8 机制 + MCA + S1），但没有反向触发 v3 战略白皮书第四节的回写动作。v3 第四节仍按 ADR-007 working 骨架行文，下游引用者可能仍按 6 机制做对接。

6. 后续推进路径

6.1 90 天内（Phase 7+ 路径）

Mundell-Fleming 实证激活：4 补充 EM case（L1 / L2 / L9 / L13）做完整 8 机制反向校准（每 case 60-130 行），激活 M5.9 子机制四层定义。
D8-D11 case 扩充：D9 跨市场对照推理必须跨 ≥ 2 MCA 桶（补 2-4 跨境同主题 case，如 A-4 + Case 5 AI 美股 vs A 股）；D10 数据可靠性需 ≥ 5 事后被证实造假 case + ≥ 15 健康对照（瑞幸 / Wirecard / 康美 / Enron 等历史 case 补入）；D11 待 M6.2.x 协方差子机制落地后扩 B4-B7 桶。
半人工标注 SLA 落地：M5.3 (c)(d) / MCA 轴 4 N3 / M7.meta-v1 的 reviewer 工作流 24 小时 SLA 附录写回 Phase 5 治理稿。
架构 ADR-008 supplement 起草：finbayes-arch-rewrite 工作流承接 5 字段 + 1 元数据 + TransmissionGraph correlation_regime 字段。本工作流配合做接口对齐 mini-sync。
T4 14 case 摘要表更新：合并 L1 / L2 / L9 / L13 + 新增 MCA 轴 7 触发列 + 修正 L 编号冲突。
v3 战略白皮书第四节回写 patch：6 机制 → 8 机制 + MCA + S1 文字更新（走 governance/change-protocol 战略级流程）。

6.2 1 年内（v1 → v2 路径）

T0 v1 落地 → T0+1 月首次月度评估 → T0+3 月首次季度全量评估 → T0+6 月 Phase 6+ 启动 → T0+12 月 v1 → v2 升级窗口。
v1 → v2 过渡门槛 ≥ 4 case 跨 ≥ 2 桶 + 1 pending 桶证据。具体候选：M5.9 完整激活 / 6 项学界不确定性中至少一项收口 / 评测体系实跑 ≥ 1 季度全量。
13 项 R1 未触及项中至少 5 项纳入 v2（Dalio 生产率时钟 / Black-Litterman / S1 模式 e/f / D2 内部三类拆分等）。

6.3 长期（vN → vN+1 路径）

恢复 ≥ 5 case 跨 ≥ 3 桶稳态门槛。
Phase 5 治理流程实际运转（首次 vN → vN+1 升级走完 14 天异议期 + 3:1 多数否决 + ADR-009 audit trail 留痕全流程）。
6 项学界不确定性的跟踪机制（EMH 边界 / DCF vs Multiples 适用性 / 偏差是错误还是适应 / 市场效率时变性 / 凯利公式可用性 / MPT 协方差失稳归因）建立外部学界跟踪小组。
案例库从 18 扩到 100+ case，进入"用户实战反馈 + 业内方法论演进 + 金融市场新场景"三触发源并行运转。

7. 致谢与归档

7.1 各 Phase 主要参与者

Phase 1 学界方法论对照：单 sub-agent（task a46d2b1831c2f6a5c）。
Phase 1.5 Prep 三 agent 并行：Prep-1 case 标答库 / Prep-2 学术框架落位 / Prep-3 A 股本土因素。
Phase 2 反向校准：14 + 4 case agent（每 case 一 agent，三批分推），加批 1 / 批 2 中期评估 agent + 最终综合 agent。
Phase 3 五 agent 并行起草：T1 8 机制升级 / T2 MCA / T3 S1 / T4 14 case 摘要 / T5 mini-review。
Phase 4-5：评测体系 1 agent + 治理机制 1 agent。
Phase 6 三 reviewer 并行：R-A 金融专家 / R-B 工程实施 / R-C 评测视角，加 R1 综合裁决。
Phase 6 R1 修订五 agent 并行：T1 8 机制全修 / 评测全修 / MCA+S1+治理 / 14 case 扩 4 个 / 架构 ADR inbox proposal。
Phase 6 R2 mini-review：1 agent 做收口自检。
Phase 7 formalize：1 agent 主稿落盘 + T4 摘要表更新 + 半人工标注 SLA + 架构 ADR proposal 二次校对。

7.2 关键决策时刻

Phase 1 D1 拍板：6 机制 → 8 机制（拆 M2 信息源 + 拆 M7 行为偏差 + 不确定性量化为独立机制），其余调整后续看 case。
Phase 2 综合阶段 3:1 否决 M9：「叙事-数字一致性」候选机制 3:1 否决，改走 S1 横切子流程路径（首次验证"装回原型"默认偏好）。
14 case → 18 case 扩充决议：R-A P1-3 提议补 L7 / L2 / L9 / L13 激活 MCA 轴 7 + M5.9 占位，R1 综合裁决接受。
R1 修订路径 K1 选 (a)：P0 全修 + P1 全修，约 25-40 小时，sub-agent 并行各项 P0。
架构 ADR 走 inbox proposal 而非本工作流自起：保持工作流职责边界，不越权改 ADR-008。
R2 mini-review 自检收口而非二次返工：R2 报告 14 条 🔴 → 9 ✅ + 3 🟡 + 2 🔴（留 Phase 7+）通过 formalize。

7.3 归档建议

本 workstream 转 stable。理由：

Phase 7 ADR-007 supplement 已 accepted 落盘。
Phase 8 案例库雏形通过 18 case 报告 + Prep-1 标答库就位。
Phase 9 复盘本身即本文件。
后续推进（Mundell-Fleming case 激活 / D8-D11 case 扩充 / 半人工标注 SLA / 架构 ADR-008 supplement 起草 / v3 战略白皮书回写）均通过 inbox proposal + governance/change-protocol 触发，不需要本 workstream 保持 active 拉锯。
若 1 年后 v1 → v2 升级窗口启动，建议新起 finbayes-cognition-system-v2/ workstream 而非复活本 workstream（避免 audit trail 混淆）。

status / maturity 由 active 改为 stable。本 retrospective 即 stable 转入的收口锚。

关联资产

来源 ADR：decisions/ADR-007-supplement-金融认知体系第一版正式构成.md
5 份 R1 修订主稿：见 supplement §6
18 case 报告：见 drafts/
Phase 6 review 全部：见 reviews/
上位工作流：governance/workstreams/finbayes-whitepaper-rewrite/（v3，已 stable）
同级 v3 工作流复盘：governance/workstreams/finbayes-whitepaper-rewrite/2026-05-28-retrospective.md
meta-playbook v1.1：commons/playbooks/document-workflows-meta-playbook.md
架构 ADR 起草请求：governance/proposals/inbox/2026-05-28--finbayes-cognition-mechanism-output-extension-to-adr008.md

工作流定位​

1. 工作流全程量化指标​

2. 工作流方法论评估​

2.1 meta-playbook v1.1 已验证有效的范式​

2.2 候选 meta-playbook v1.2 新范式（本工作流首次实践）​

2.3 不顺利 / 需要在 meta-playbook 中显式预警的反模式​

3. 与 v3 战略白皮书工作流的对比​

4. meta-playbook v1.1 → v1.2 反馈建议​

4.1 推荐入 v1.2 的新范式（5-8 项）​

4.2 已有范式的调整建议​

4.3 显式预警 / 反模式（应入 v1.2）​

4.4 工具建议​

5. 本工作流自身的不足与遗憾​

6. 后续推进路径​

6.1 90 天内（Phase 7+ 路径）​

6.2 1 年内（v1 → v2 路径）​

6.3 长期（vN → vN+1 路径）​

7. 致谢与归档​

7.1 各 Phase 主要参与者​

7.2 关键决策时刻​

7.3 归档建议​

关联资产​