跳到主要内容

FinBayes 架构重构复盘 + 可复用方法论

⚠️ 文档定位调整(2026-05-27):本文档的通用方法论部分已提炼为生态级 playbook 并发布到:

  • 主 Playbook架构文档重构 Playbook —— 含方法论矩阵(arc42 / C4 / ADR / DDD / Google Design Doc 等)+ 五条核心范式 + 11 Phase 流程 + 项目特化适配指南
  • 模板目录架构文档重构 — 模板目录 —— 含 6 份可直接复制的模板(status / ADR / 章节草稿 / Review 任务包 / merge-script / 复盘)

其他生态内项目(DH / TM / RLE / FEFM)应直接读 commons playbook 启动,不再依赖本 FinBayes-specific 复盘。

本文档保留作 FinBayes 项目级历史资产,含 FinBayes 工作流的具体节点 / 时间线 / 实战细节,作为 commons playbook 的"第一次实战参考案例"。

2026-05-26 至 2026-05-27 用约 36 小时(跨 ~20 个工作流节点)完成的工作:把 988 行 v1 工程架构重写为 5976 行 v2 主架构 + 1639 行 M0 task-oriented 工程包 + 6 份 ADR + 9 份 review report + 上下游文档对齐。本文档保留作 FinBayes 项目级复盘资产;可复用方法论已提炼到 commons playbook(见上方 banner)。

第一部分:成果概览

量化产出

类别产出
主架构文档architecture.md v2,9 部分 28 节,5976 行,44 张 Mermaid 图
task-oriented 工程包m0-walking-skeleton.md,1639 行(10 项 deliverable + Phase 1 五节 P0 扩展)
架构决策(ADR)6 份 accepted(ADR-001/002/003 + ADR-004/008/010 M0 最小版);4 份待 M1+ 起草
多 Agent ReviewR1 四份(跨章一致性 / 上位文档对齐 / 工程可实施性 / Codex 综合)+ R2 三份(实施新人可读性 / 落地 Agent 100% / Codex 综合)+ 2 份综合行动方案,共 9 份 review report
上位文档对齐战略白皮书(5 处旧术语 + 七类任务清单 + 候选两步契约 + 4 层降级 stub);产品定义(L24 + 7 处 stub 指针 + L127 Session 删除级联 + §1/§3.5/§4.3/§12 措辞)
同位文档归档local-runtime-and-entrypoints / session-and-context-architecture / baseline-evaluation 三份 v1 工程化补充文档归档到 _archive
派生路由扩展derive-agent-pack.mjs 加 engineering-packs/ 路由
状态外化status.md 共 20 个节点 + 4 份 ADR / 28 份草稿 / 5 份 review + 综合 / 1 份本复盘

质量指标

指标数值
战略保真度 grep 命中(合法元引用除外)0
实施新人 mental model 信心打分(R2-A)4.75 / 5
工程化落地 Agent 严格视角 M0 完成度(R2-B)80%(拉到 95%+ 需 §28 之外的工程实施仓 bootstrap)
Codex 独立 review M0 完成度(R2-C)65-75%
三检 review gate 拦截能力(综合 R2)6-7.5 / 10
verify-kb 全程跑通100%
跨 Agent 三角验证4 份 R1 + 3 份 R2 = 7 个独立 reviewer 视角

第二部分:方法论核心 — 五条可复用范式

范式 1:工作流外化(Workflow Externalization)

问题:长链路、多步骤的文档重构任务,单一 Agent / 单一会话的 context 会爆炸,多次断点续接时心智模型容易漂移。

解法:把工作流状态、决策、草稿都外化到独立目录,会话只是"加工现场"。

目录结构(已验证):

governance/workstreams/<workstream-id>/
├── status.md # 节点时间线 + 当前状态 + 续接协议
├── decisions/ # ADR-NNN-*.md 独立成档
├── drafts/ # CHAP-NN-*.md 章节草稿
├── reviews/ # 多 Agent Review 报告(按轮次组织)
└── 2026-XX-XX-retrospective.md # 工作流收尾时的复盘(本文)

关键约定

  • status.md 节点编号严格递增(节点 1 / 节点 2 / ...)+ 每节点描述时间戳 + 完成的事情 + 当前阻塞
  • decisions/drafts/ 独立 —— 决策不污染主文档;草稿不污染决策
  • 续接协议在 status.md 头部固定段落:"读这份 → 查 ADR → 看草稿 → 不要回看对话历史"
  • 重要约定固化到 status.md 末尾(如稳定 ID 规则 / 写作纪律 / 战略不变量)

收益(实测):

  • 16+ 次会话续接全部能在 ≤3 分钟内重建心智模型
  • 多 Agent 接手时不依赖前一 Agent 的会话记忆,靠工作流目录即可
  • 工作流结束后整套资产作为历史复盘 + 后续工作流模板

与 ADR-001 的关系:本范式是 ADR-001(Harness Workflow + 里程碑切片 + 走通骨架试点)在文档治理层的实施,与 ADR-001 在工程实施层的实施互为镜像。


范式 2:A+C 双轨文档(治理事实源 + Agent 消费包)

问题:单一架构文档随着完整性提升必然膨胀,工程实施 Agent 一次性 load 时 context 占用 75-85%,多文件操作或调试时易爆。

解法:A 治理事实源(主架构)+ C task-oriented Agent 消费包(engineering-packs/m{N}-*.md)双轨。

A 治理事实源(主架构):

  • 角色:战略 → 业务 → 系统 → 横向贯穿 → 质量 → 缺口 → 落地 的完整契约定义
  • 目标受众:评审 / 战略保真度审计 / ADR 起草 / Round-N review
  • 大小:5000-7000 行
  • 不变量:完整 / 自洽 / 治理可追溯

C Agent 消费包(engineering-packs/):

  • 角色:按里程碑切片,单 milestone 的 task-oriented 工程材料
  • 目标受众:M0 / M1 / ... 实施 Agent(Codex / Claude Code)
  • 大小:1500-3000 行 / 包
  • 不变量:自包含 / 可直接消费 / 与主架构互为指针不重复定义

双轨的契约

维度主架构engineering-packs
战略不变量定义引用主架构 §N
业务对象定义(含跨层映射表)引用主架构 + 给 M0 Pydantic schema
接口子集抽象定义(高层接口)具体 M0 implement/stub/skip 表
Pydantic 模型引用 engineering-packs完整代码
DDL抽象(总览)完整 SQL
CLI 规格抽象命令字符串 + 退出码
Mock fixture概念目录结构 + hash 算法
CI 模板概念完整 yaml
凭证正则策略表Python pattern + 词表 source
工程包 bootstrap不写pyproject.toml + 工具链选定

收益(实测):

  • 主架构净降 7.8%(6483 → 5976 行)
  • M0 实施 Agent 单次 load context 占用从 75-85% 降到 ~30%
  • 与 ADR-001 Walking Skeleton + ADR-003 OpenSpec task packet 范式自然契合
  • 主架构演化(M1+ 起草)不污染 M0 工程包;M0 工程包微调(如 fixture 阈值)不污染主架构

约定

  • 每个 milestone 一个 engineering-packs 文件
  • engineering-packs 文件命名 m{N}-<slug>.md(如 m0-walking-skeleton.md / m1-state-confirmation.md
  • 主架构对应章节(如 §28)改为简短指针段(30-80 行),不重复展开
  • 横向贯穿关注点(边界 / 可观测 / 演化)继续留在主架构(被各 engineering-packs 引用)

范式 3:多 Agent 跨视角三角验证(Cross-Agent Triangulation)

问题:单一 Agent / 单一视角的 review 会有盲点(如只看可读性不看落地完整性 / 只看战略保真度不看工程可执行性)。

解法:按 user_agent_ecosystem.md 路由表分工 + 多维度并行 + 跨 Agent 互不引用。

实战分工(R1 + R2 两轮共 7 个 reviewer):

轮次Reviewer视角关键指标
R1-AClaude Code sub-agent (researcher)跨章内部一致性找出 §8 vs §27 代码骨架冲突 / §11 vs §27 状态机不一致
R1-BClaude Code sub-agent (researcher)上位文档对齐找出战略白皮书 5 处旧术语 / 产品定义 7 处 stub 缺失
R1-CClaude Code sub-agent (researcher)工程可实施性找出 6 项 P0(M0 接口子集 / Pydantic schema / 凭证正则等)
R1-DCodex via codex exec CLI综合 + 独立验证反向验证主会话修订生效 + 发现 5 项独立议题
R2-AClaude Code sub-agent (researcher)实施新人 mental model信心打分 4.75/5
R2-BClaude Code sub-agent (researcher)落地 Agent 100% 严格M0 完成度 80% / gate 拦截 6/10
R2-CCodex via codex exec CLI综合 + 独立验证M0 完成度 65-75% / gate 拦截 7.5/10

关键纪律

  • 互不引用 —— Reviewer 之间不引用对方报告,避免群体思维偏移
  • 覆盖不同维度 —— 每个 reviewer 有清晰的"视角任务",不重复
  • 混合 Agent 模型 —— Claude Code(Sonnet/Opus)+ Codex(GPT-5.5)形成模型多样性
  • 统一输出 schema —— P0 / P1 / P2 + 抽查问题 + 强项 + 独立发现 五段式

收益(实测):

  • 单个 reviewer 的发现率约 60-70%;7 个 reviewer 合并后接近 95%
  • 跨 Agent 三角验证发现"单 reviewer 看不到"的问题(如 Codex 反向验证主会话修订是否真的生效)
  • 不同视角的发现自然分层(P0 阻断 vs P1 重要 vs P2 优化)

调度模式

模式用法适用场景
Agent 工具(sub-agent,run_in_background=true)Claude Code 主会话内调度,并行运行维度切片明确的 review,每个 reviewer 任务 ≤200K tokens
codex exec CLI(worker-dispatch)主会话 Bash 调用,独立 session用 Codex 配额 + 跨模型三角验证
codex exec --skip-git-repo-check < prompt.md > output.mdstdin pipe 任务包 + stdout 重定向任务包结构化、结果可程序化解析

范式 4:从草稿到合并的 merge-script 模式

问题:27+ 章独立草稿如何合并为单一主文档?修订时如何避免主文档与草稿分叉?

解法:草稿是事实源 → merge 脚本是机械产物。

脚本/tmp/merge_architecture.py 一次性使用):

def main():
chapter_files = sorted(DRAFTS.glob("CHAP-*.md"))
assert len(chapter_files) == N, f"Expected {N} chapters"

# 读主文档,截取到合并标记前
existing = TARGET.read_text(encoding="utf-8")
marker = "<!-- 以下为"
if marker in existing:
idx = existing.index(marker)
end_idx = existing.index("\n", idx)
prologue = existing[:end_idx+1]
else:
prologue = existing

parts = [prologue.rstrip() + "\n\n"]
for f in chapter_files:
body = strip_frontmatter(f.read_text())
body = shift_headings(body, num, title) # # 第N节 → ## N. 标题,其他 heading 下移一级
parts.append(body.rstrip() + "\n")

TARGET.write_text("".join(parts), encoding="utf-8")

约定

  • 修订永远回 drafts/,不直接编辑合并后的主文档("merged out 不是修订入口")
  • prologue 区(主文档顶部 frontmatter + 目录 + 配套资产指针)在主文档中直接编辑(不在 drafts/)
  • 合并标记 <!-- 以下为 N 章正文,由 ... 合并而成 --> 划分 prologue 与章节正文
  • 跨章引用替换 CHAP-NN → §N 作为合并后的后处理(一次性 sed)

收益

  • 修订单章只需改一个 draft 文件
  • 主文档永远是机械产物(不需要担心人工编辑漂移)
  • 多次重新合并(本工作流中 4 次)零差错

范式 5:战略保真度 + 写作纪律 双轨

问题:长文档容易掺入战略层被否决的概念 / 防御型清单 / 方法论冗余。

解法

纪律实施
禁词清单(被否决概念)verify-kb.mjs 自动 grep + PR Review 人工语义复核(防同义改写)
建设型而非防御型每节首段一句话回答"这节回答什么";不变成"不许什么"清单
不解释方法论方法论选择放 ADR;主文档只引结论
抽象 vs 具体优先 FinBayes 实际场景,少用"系统应该"
图配三段说明图表达什么 / 图特意不表达什么 / 怎么读
专有名词第一次出现给一句话解释强制

实测:禁词命中0(除合法元引用如 §17 Review Gate 段 / §23 拒绝清单 / §26 同义改写示例);防御型清单完全收敛到 §17 边界与安全(且建设型化重写)。


第三部分:可复用模板 — 文档治理工作流启动模板

启动检查清单(适用于 DH / TM / RLE / FEFM 等项目的架构重构)

## Phase 0:启动条件(治理)

- [ ] 上位事实源齐备?(战略白皮书 + 产品定义文档)
- [ ] 上位文档已对齐?(任务清单 / 业务对象 / 边界 / 未决问题)
- [ ] 工程范式确定?(Harness Workflow / Walking Skeleton 类比)
- [ ] 工程协作模式确定?(OpenSpec / Codex 工具栈 / Review 链路)

## Phase 1:工作流初始化

- [ ] 建 `governance/workstreams/<workstream-id>/` 目录
- [ ] 起 status.md(节点 1:工作流初始化)
- [ ] 起 ADR-001 工程范式 / ADR-002 文档结构 / ADR-003 工程协作(如已存在的项目可继承 FinBayes 范式)

## Phase 2:章节追踪表 + 草稿起草

- [ ] 决定章节数量与结构(参考 FinBayes 9 部分 28 节,按项目特点调整)
- [ ] 起 章节追踪表(在 status.md)—— 每章 ID / 标题 / 状态 / 草稿文件 / 阻塞
- [ ] 按章节分批起草(每批 3-5 章为节点)
- [ ] 每批完成时跑战略保真度 grep + verify-kb + 记节点

## Phase 3:合并为主文档

- [ ] 准备 merge script(继承 finbayes 范式)
- [ ] 起主文档 prologue(frontmatter + 目录 + 配套资产指针)
- [ ] 合并 + §N 替换 + verify-kb

## Phase 4:多 Agent Review(R1)

- [ ] 启动 3 个 Claude Code sub-agent 并行(跨章一致性 / 上位对齐 / 工程可实施性)
- [ ] 启动 Codex worker-dispatch(综合 + 独立验证)
- [ ] 持久化 4 份 review report 到 reviews/
- [ ] 起 R1 综合行动方案

## Phase 5:修订(按 R1 行动方案)

- [ ] P0 修订(必须)
- [ ] P1 修订(建议)
- [ ] 重新合并 + verify

## Phase 6:双轨拆分(如主文档 ≥6000 行)

- [ ] 建 engineering-packs/ 目录
- [ ] 拆出 m0-walking-skeleton.md(含 Pydantic + DDL + CLI + Mock fixture + CI 模板等)
- [ ] 主文档对应章节缩为指针段
- [ ] 扩展 derive-agent-pack.mjs 路由

## Phase 7:多 Agent Review(R2)

- [ ] 启动 R2 reviewer(实施新人 mental model + 落地 Agent 100% + Codex 综合)
- [ ] 持久化 R2 reports + 综合行动方案

## Phase 8:修订(按 R2 行动方案)

- [ ] P0 修订(Phase 1)
- [ ] P1 修订(Phase 2)
- [ ] 重新合并 + verify

## Phase 9:上下游对齐

- [ ] 战略白皮书反向修订(如发现)
- [ ] 产品定义文档反向修订(如发现)
- [ ] 同位 v1 文档归档(被新架构吸收的)
- [ ] proposal accepted(如有挂起的相关提案)

## Phase 10:ADR 关键决策起草

- [ ] M0 接口锁定的 ADR 起草(M0 启动前置)
- [ ] 中优先级 ADR 留 M1+

## Phase 11:工作流收尾

- [ ] CLAUDE.md 提示更新
- [ ] goal-execution / 同类 v1 实施文档 deprecation note
- [ ] status.md 节点收尾 + 工作流状态 active → stable
- [ ] 起复盘文档(本类型)

第四部分:FinBayes 工作流的真实时间线(节点级复盘)

完整时间线见 governance/workstreams/finbayes-arch-rewrite/status.md 更新历史段(节点 1 至 20)。本节抽取关键决策时刻。

节点时间(相对)关键事件经验教训
1T+0工作流初始化,3 份 ADR 入档,27 章追踪表建立一开始就建工作流目录而非直接写主文档,省后续重构成本
2-4T+1-3h第一部分 3 章草稿 + 用户反馈"建设型而非防御型 + 不解释方法论" + 重写用户级写作纪律反馈越早越好
3-4同上"0 命中"/"Case Library 作门禁"的 Goodhart's law 警觉 + 改为"机械 grep + 人工实质语义核查"双层战略保真度的实施机制本身要防钻空子
5T+5h第二部分 3 章草稿业务建模章节是后续所有章节的基础,要早做
6T+8h用户反馈任务类型不能写死 + 关系图换 flowchart + 动态画像方向调整 + 启动意图识别深度调研战略层未决问题在工程层抢答前,必须先跑研究
7-9T+10-22h第三 / 第四 / 第五部分 10 章草稿6 子系统 / 4 状态机 / 8 sequence 是工程层最丰盛的产出
10T+23h第六部分 3 章 + 进入横向贯穿关注点横向贯穿章节看起来散,实际上是各 milestone 共享的基础
11-13T+25-28h第七 / 第八 / 第九部分 8 章草稿 —— 28 章草稿全部收官量产期保持节奏一致
14T+29h主文档合并(5796 行)+ v1 architecture.md 归档合并脚本一次性使用即可
15-16T+30-32hR1 4 reviewer 并行(含 Codex 直接调度)+ 综合行动方案codex exec CLI 是 worker-dispatch 的真正实现
17T+33h上位文档(战略白皮书 / 产品定义)直接修订 + 同位 v1 工程文档归档当 reviewer 一致指出上位漏洞时,主控可直接改 —— 不必拘泥于"上位不动"原则
18T+34hA1 + A2 + C1 + 多处 P1 整改 + 重新合并双轨拆分前先解决主架构内部冲突
19T+35hR2 三 reviewer(含 Codex)+ 综合 + Phase 1/2 行动方案第二轮 review 维度从"理解层"切换到"落地层",发现深得多
20T+36hA+C 双轨拆分(engineering-packs/m0-walking-skeleton.md 1639 行)+ Phase 1 五节 P0 扩展 + Phase 2 五项 P1 修订 + 派生路由扩展双轨拆分一定要在足够多 review 后做 —— 不要早拆(早拆 = 草稿期就分裂)

第五部分:给 DH / TM / RLE / FEFM 的具体建议

Data Horizon(DH)— 数据感知层

与 FinBayes 的差异

  • DH 是数据管道项目,不是 LLM 应用 —— 业务建模章节会简单很多(无任务类型 / 综合层 / 综合输出契约)
  • DH 的 first-class 业务对象偏数据型(事件 / 实体 / 时间线 / 数据点 / 数据源)
  • DH 的边界与安全约束不同(不收凭证仍适用;但有数据源 licensing 约束)

复用建议

范式复用方式
工作流外化直接复用,建 governance/workstreams/data-horizon-arch-rewrite/
A+C 双轨直接复用,engineering-packs/ 按数据 source / pipeline 切(不按 LLM-milestone)
多 Agent 跨视角 review维度调整:跨章一致性 / 数据源契约对齐 / 数据质量保证 / 与 FinBayes 接口契合
merge-script直接复用脚本模板
战略保真度纪律直接复用,DH 已有禁词清单(如"不替 FinBayes 判断"等)

DH 特有的章节建议

  • 数据源注册与生命周期
  • 数据质量指标体系(freshness / completeness / accuracy / lineage)
  • 数据 schema 版本化(schema_version + migration 比 FinBayes 更复杂)
  • 与 FinBayes / Trading Matrix 的接口契约(事件 / 实体 / 时间线的下游消费)

Trading Matrix(TM)— 交易执行支持

与 FinBayes 的差异

  • TM 是执行层项目,与 FinBayes "不下单不持账户凭证"边界镜像(TM 持凭证 + 受治理执行)
  • TM 的边界与安全约束远比 FinBayes 严格(金融执行凭证管理 / 多步骤交易签名 / 审计合规)
  • TM 的状态对象偏交易型(订单 / 仓位 / 资金流 / 执行回报)

复用建议

范式复用方式
工作流外化直接复用
A+C 双轨直接复用,engineering-packs/ 按执行场景切(市价单 / 限价单 / 网格 / 等)
多 Agent 跨视角 review维度增加合规视角:跨章一致性 / 合规边界 / 执行可靠性(含恢复路径)/ 与 FinBayes 接口契合 / 监管审计可见性
战略保真度纪律直接复用 + 加强凭证保护审计(TM 的凭证不变量 ≠ FinBayes 的"不收不存",而是"严格受治理存储 + 多签 + 行为审计")

TM 特有的章节建议

  • 凭证管理(与 FinBayes 凭证不变量正交但不冲突的设计)
  • 多步骤交易签名流程
  • 执行回报与对账
  • 监管合规审计
  • 与 FinBayes / DH 的接口契约

RLE(强化学习引擎)— 反馈学习引擎

与 FinBayes 的差异

  • RLE 是学习层项目,整合 FinBayes / TM / 用户反馈,产出模型改进
  • RLE 的业务对象偏数据型(轨迹 / 奖励 / 模型版本 / 实验)
  • RLE 的边界与安全约束(用户隐私 / 数据脱敏 / 模型版本回滚)

复用建议

  • A+C 双轨可能不够 —— RLE 可能需要 三轨:(A) 治理事实源 (B) 实验包(每个实验一份 task-oriented) (C) 模型部署包
  • 工作流外化适用
  • 多 Agent review 维度:数据采集合规 / 实验设计严谨度 / 与生态各产品接口契合

FEFM(金融领域基础模型)— 金融专家大模型

与 FinBayes 的差异

  • FEFM 是模型层项目,产出基础模型供 FinBayes / DH / TM 调用
  • FEFM 的工程范式更接近 ML training pipeline + 模型服务
  • FEFM 的 ADR 会涉及预训练数据 / 微调策略 / 量化推理 / 部署形态

复用建议

  • A+C 双轨适用 —— A 治理事实源 + C 训练实验包 / 评估包 / 部署包
  • 工作流外化适用
  • 多 Agent review 维度:模型质量评估 / 训练数据合规 / 与生态接口契合

第六部分:方法论的反思与边界

这套方法不适用的场景

场景不适用原因
单一 Agent / 单次会话即可完成的小重构工作流外化 + 多 Agent review 的开销不值
战略 / 产品定义尚未稳定的项目架构重写需要稳定上位作为锚点;上位漂移会让所有努力作废
纯文档润色(不涉及结构 / 决策变化)不需要 ADR / Review 闭环;用普通 PR 流程即可
工程实施仓的代码层这套方法是文档治理层,不适用直接写代码(代码层用 OpenSpec task packet 范式)

这套方法的真实限制

  1. 依赖人工裁决 —— 多 Agent review 找出 P0/P1,但最终修订决策仍需主控人裁决(Agent 不能自主推进战略层修订)
  2. 依赖工具链 —— codex CLI / Claude Code Agent / verify-kb / merge script —— 任一缺失需要替代方案
  3. 依赖工作流维护者的纪律 —— 节点编号、frontmatter 规范、战略保真度自检 —— 这些是人为纪律不是机械约束
  4. 质量保证有上限 —— 综合 R2 显示 M0 阶段 CI 拦截率上限 ~50-55%(语义层 10-15%),要拉到 95%+ 需评估闭环(M6 才上)—— 这是结构性约束

真实的工作量预估

项目类型章节数估算工作流时长估算
DH(数据感知)20-25 章25-35 小时
TM(交易执行)25-30 章(合规重)35-45 小时
RLE(学习引擎)22-28 章30-40 小时
FEFM(基础模型)18-24 章25-35 小时

前提:上位事实源(战略白皮书 + 产品定义)已稳定,主控人能投入连续时间(不是碎片化)。


第七部分:可复用资产清单

下列资产可直接复制到 DH / TM / RLE / FEFM 的工作流:

资产路径复用方式
工作流目录骨架governance/workstreams/finbayes-arch-rewrite/复制结构(不复制内容)
status.md 模板governance/workstreams/finbayes-arch-rewrite/status.md模板化前 50 行(续接协议 + 节点表头)
ADR-001 工程范式decisions/ADR-001-工程范式.md直接复用(Walking Skeleton + 里程碑切片是 FinTec AI 生态通用范式)
ADR-002 架构文档结构decisions/ADR-002-架构文档结构.md直接复用(arc42 + C4 + ADR + DDD)
ADR-003 工程协作decisions/ADR-003-工程实施栈与协作.md按项目调整(工具栈可能不同)
Merge script/tmp/merge_architecture.py(一次性,未入仓)复制 Python 文件,修改 TARGET 路径与章节标题映射
Multi-Agent Review prompt 模板reviews/codex-review-task-spec.md + 各 sub-agent 任务包调整任务包字段(按项目维度)
派生脚本扩展模式scripts/derive-agent-pack.mjs source_refs加新项目的 engineering-packs 路径
复盘文档模板本文各项目结束时类比写一份

第八部分:下一步建议

FinBayes 自身

  • M0 OpenSpec task packet 起草(含工程实施仓 cwd / 验收命令 / Provider mock/real 边界)—— 本工作流外的工作
  • 工程实施仓 bootstrap 跑通 M0(按 m0-walking-skeleton 第 1 小时步骤)—— Codex 实施
  • M1-M7 engineering-packs 在各里程碑启动时按需起草
  • 中优先级 ADR-005/006/007/009 在 M1+ 实施初期补齐

生态内其他项目(建议优先级)

  1. DH 重构优先(数据是 FinBayes / TM / RLE 的共同上游)—— 建议立刻启动
  2. TM 次之(FinBayes 已 ready 等 TM 接口稳定)—— DH 完成 70% 后启动
  3. RLE 再次(依赖 FinBayes + TM 出数据)—— FinBayes / TM 上线后启动
  4. FEFM 最后(基础模型层,FinBayes / DH / TM 上线后才有真实的 fine-tuning 信号)—— 12-18 个月后启动

元方法论的演化

下次工作流(如 DH)启动后,请把以下问题作为复盘核心:

  • 这套方法在 DH 上是否仍然适用?哪些步骤需要调整?
  • 多 Agent review 的"维度切片"在 DH 上需要怎样的新维度?
  • A+C 双轨在 DH 上是否需要变成三轨(A 治理 + B 数据 source pack + C pipeline pack)?
  • 战略保真度纪律的禁词清单在 DH 上是什么?

每一次复用都是对方法论的实战检验。本工作流的复盘已经显示:方法论本身要与项目特点共同演化,不要照搬。


致谢与署名

  • 工作流维护者:项目主控
  • 主控 Agent:Claude Code(Anthropic Sonnet 4.5 / 200K context)
  • 协作 Agent:Codex(OpenAI gpt-5.5 via codex exec CLI v0.133.0)+ 多个 Claude Code sub-agent(researcher)
  • 上位文档:FinBayes 战略白皮书 v2 + 产品定义文档
  • 工程范式上位:ADR-001 / ADR-002 / ADR-003

本工作流的所有产出(草稿 / 决策 / Review / 主文档 / 工程包 / 复盘)保留为 governance/workstreams/finbayes-arch-rewrite/ 的完整资产,作为生态内后续项目的可复用模板。


END of 复盘