FinBayes 工程化文档全面排查报告(2026-05-28)
0. 执行摘要
npm run verify:kb 通过。覆盖 35 份核心文档(5 engineering-packs + 5 子系统 + 4 主目录 + 4 ADR + 1 sync workstream + 4 phase drafts + 3 for-agents 派生 + 2 harness 工件 + 3 战略 cross-ref + 1 入口汇总)。整体健康度:结构层面(cross-reference 网络 / source-of-truth 分工 / snake_case 终态)已成型;但 .archon workflow yaml 1 处 P0 死链 + ADR-008 supplement §1/§3.1 中「5 字段」未同步为最终结论「6 字段」,加 2 处后会出现实施 Agent 立即失败 / schema 校验冲突。P0 修完即可启动 C-1;P1 7 条用词同步 / P2 12 条优化可并行 / 推迟 M0 收尾。
1. 排查范围与方法
| 类 | 数量 | 位置 |
|---|---|---|
| L2/L3 主目录 | 4 | engineering/{README, product-definition, architecture, architecture-anti-bloat-guard} |
| engineering-packs | 5 | engineering-packs/{m0-walking-skeleton, cognition-1.1-contract, data-providers, eval-harness-formulas, data-splits} |
| subsystems | 5 | subsystems/{README, knowledge-graph-service, consistency-middleware, mca-classifier, eval-harness} |
| 架构 ADR | 4 | ADR-008 Provider 接口 / ADR-008 supplement / ADR-009 / ADR-007 supplement |
| sync workstream | 1 | sync-plan-adr007-supplement.md |
| phase drafts(摘读关键节) | 4 | Phase 3 mechanisms-v1 / Phase 4 evaluation / Phase 5 iteration / Phase 7 SLA |
| for-agents 派生 | 3 | topics/finbayes-m0-implementation/{agent-pack.yaml, manifest.json, llms.txt} |
| harness 工件 | 2 | .archon/{README, workflows/milestone-M0.yaml} |
| 战略 cross-ref | 3 | strategic-whitepaper §4/§10 + ecosystem/glossary |
| 入口汇总 | 1 | 2026-05-28-pre-engineering-readiness.md |
方法:frontmatter + 关键节正文 + 五维度交叉对比(grep + 字段名一致性 + ID 闭环)。
2. 重复发现
| ID | 内容 | 出现位置 | source of truth | 建议动作 |
|---|---|---|---|---|
| DUP-1 | 1.1 顶层 6 字段定义 | ADR-008 sup §2 / cognition-1.1-contract §1-2 / m0-pack §3.5 / 4 子系统 §2 / eval-harness-formulas §8 / product-def §7.3 | ADR-008 sup(语义)+ cognition-1.1-contract(schema) | 4 子系统接口段去掉子模型字段列,保留接口签名 + 「事实源指针」 |
| DUP-2 | 8 机制 M1-M8 | ADR-007 sup §2.1 + product-def §6.4 + Phase 3 mechs + strategic-WP §4 + arch §29 | ADR-007 sup §2.1 | 现状 OK,5 处皆是引用 + 单句概括 |
| DUP-3 | MCA 7 分轴三档枚举 | ADR-007 sup §2.2 / cognition-1.1-contract §2.7 + §5 / ADR-008 sup §2.7 / mca-classifier §1 / Phase 3 MCA | ADR-007 sup §2.2 | mca-classifier §1 重述三档语义,改为 1 行指针 + 接入要点表 |
| DUP-4 | S1 4 失败模式 a/b/c/d | ADR-007 sup §2.3 / ADR-008 sup §2.6 / consistency-middleware §1 / Phase 3 S1 / cognition-1.1-contract §2.6 | ADR-007 sup §2.3 + ADR-008 sup §2.6 | consistency-middleware §1 改为「枚举 + 一行业务标签」+ 指针 |
| DUP-5 | 11 维评测公式 D1-D11 | Phase 4 / ADR-007 sup §2.4 / eval-harness-formulas §1 / eval-harness §1 / mca-classifier §1 | eval-harness-formulas(工程公式)+ Phase 4 | eval-harness §1 D1-D11 文本展开与 ADR-007 §2.4 重复,改为 1 行表头 + 指针 |
| DUP-6 | M0 1.1 最小子集字段 | m0-pack §3.5 / ADR-008 sup §5.2 / cognition-1.1-contract §0 + §7 / arch §29 末段 | m0-pack §3.5 | arch §29 末段重述了 M0 子集字段,违反 anti-bloat-guard 索引粒度;改为「详见 m0-pack §3.5」 |
| DUP-7 | IAA kappa 三阶门槛 0.65/0.70/0.75 | Phase 4 / Phase 7 SLA §三 / eval-harness-formulas §5 / eval-harness §1+§5 / consistency-middleware §5 / mca-classifier §5 | Phase 7 SLA §三表 | 保留 Phase 7 SLA + eval-harness-formulas 明文表;其它处仅指针 |
3. 冗余发现
| ID | 内容 | 当前位置 | 建议动作 |
|---|---|---|---|
| RED-1 | m0-pack §3 1.0 schema 主体(已被 §3.5 升级到 1.1) | m0-pack §3 §3 末 | 加 1 行 status:「M0 双 schema 并存,M1+ 合并到契约源 §5 后本节降为 superseded」 |
| RED-2 | Phase 3 mechanisms / MCA / S1 drafts | drafts/ | frontmatter 加 source-of-truth-for: adr-007-supplement 明示仍是 active 事实源(不是过时 draft) |
| RED-3 | Phase 4 / Phase 5 / Phase 7 drafts | drafts/ | 同 RED-2 |
| RED-4 | Phase 5 iteration-governance §3.3 + 多处写「MCA 6 轴」 | drafts/2026-05-28-phase5-...md L60+L101+L150 | ADR-007 sup R-A P0-2 已加轴 7;draft 文本应「6 → 7」 |
| RED-5 | Phase 4 evaluation-system §3 写「M3.t1-M3.t7 七类时钟」 | drafts/2026-05-28-phase4-...md L75+L81 | ADR-007 sup §2.1 已立 9 类(+M3.t8 Koo / M3.t9 Minsky);draft 「7 → 9」或加 superseded 标签 |
| RED-6 | arch §29 末段「v1 实现路径建议」列 M0 子集字段细节 | arch §29 末段 | anti-bloat-guard 80 行约束允许索引段;细节列字段超粒度。改为「M0 子集详见 m0-pack §3.5」+ 4 个里程碑路径标签 |
4. 不完整发现
| ID | 缺失项 | 应补到 | 优先级 |
|---|---|---|---|
| INC-1 | 4 子系统「实现里程碑映射」段 | 各子系统加 §9「子机制 → M0/M1/M2/M3 落地」表 | P1 — ✅ 已修 (2026-05-28),4 子系统(knowledge-graph-service / consistency-middleware / mca-classifier / eval-harness)各加 §9 M0/M1/M2/M3 落地范围 + 不落地清单表 |
| INC-2 | cognition-1.1-contract §5 mca_bucket.worst_axis 类型 + tag_version pattern 约束 | cognition-1.1-contract §1 + §4 | P2 |
| INC-3 | data-providers / eval-harness-formulas / data-splits 三 pack 互相 cross-reference 不完整 | 三 pack 头部加双向指针 | P2 |
| INC-4 | m0-pack §15 关联资产未引用 data-splits(M0 case 库分集前提)+ architecture-anti-bloat-guard | m0-pack §15 补两条指针 | P2 |
| INC-5 | cognition-1.1-contract §8 worst_axis pending 未引 mca-classifier §7 v1 排序 | §8 加 1 行「v1 起步排序见 mca-classifier §7」 | P2 |
| INC-6 | M0 yaml ai-cognition-schema.related_pack 缺 cognition-1.1-contract | yaml 加为第二项 related_pack | P1 — ✅ 已修 (2026-05-28),related_pack 改为列表含 m0-walking-skeleton + cognition-1.1-contract 两项 |
| INC-7 | topic agent-pack.yaml sources 缺 architecture-anti-bloat-guard + Phase 4/5 drafts | sources 加 3 项 | P1 — ✅ 已修 (2026-05-28),sources 补 architecture-anti-bloat-guard + phase4-evaluation-system + phase5-iteration-governance 3 项,notes 同步更新 |
| INC-8 | 4 子系统无「§0 范围与定位」段(engineering-packs 5 份都有) | 4 子系统补 §0「事实源 / 派生关系 / status 语义」 | P2 |
| INC-9 | ADR-008 sup / ADR-007 sup §6 缺反向指针到 cognition-1.1-contract | 两 ADR §6 各加「工程契约派生源: engineering-packs/cognition-1.1-contract.md」 | P2 |
| INC-10 | M0 yaml ai-eval-harness-m0.related_pack 缺 eval-harness-formulas(公式事实源) | yaml 加为 related_pack | P1 — ✅ 已修 (2026-05-28),ai-eval-harness-m0 inputs 新增 related_pack 列表含 eval-harness-formulas |
5. 冲突发现
| ID | 不同说法 | 正确版本 | 修复动作 |
|---|---|---|---|
| CONF-1(P0) | .archon/workflows/milestone-M0.yaml:94 ai-semi-manual-sla 节点 anchor_doc: projects/finbayes/engineering/phase7-semi-manual-annotation-sla.md 该文件不存在 | 实际在 governance/workstreams/finbayes-cognition-system-research/drafts/2026-05-28-phase7-semi-manual-annotation-sla.md | 修 yaml anchor_doc 路径 — ✅ 已修 (2026-05-28),milestone-M0.yaml L94 anchor_doc 指向 drafts 路径 |
| CONF-2(P0) | ADR-008 sup §1 引用段 + §3.1 第 1+2 项写「5 新字段」;§4.1 末段 audit trail 显式纠正为「6 字段 + 1 元数据」;product-def L163 + L186 也写「5 字段」;cognition-1.1-contract / m0-pack / 4 子系统全部以 6 字段为准;eval-harness §6 已有注释指出此漂移 | 6 字段(applicability_flags + phase_evidence + causal_graph + regulation_status + posterior + s1) | 修 ADR-008 sup §1 / §3.1 + product-def 「5 → 6」(保留 §4.1 audit trail 段说明)— ✅ 已修 (2026-05-28),ADR-008 sup §1 + §3.1 + product-def L163 + m0-pack L609 + eval-harness §6 L140 全部统一为「6 顶层字段 + 1 元数据」并显式列字段名 |
| CONF-3(P1) | 「7 MCA 桶」vs「8 MCA 桶」措辞漂移 | ADR-007 sup §2.4 / eval-harness §1 / mca-classifier §1 / Phase 4 §五 写「7 桶」;eval-harness-formulas §3 写「7 MCA 桶(B5 拆实际 8 桶)」;入口汇总 L78 写「8 MCA 桶」 | 7 桶概念层 / 8 label 实施层并存 |
| CONF-4(P1) | Phase 4 §3 写「M3.t1-M3.t7 七类时钟」 | ADR-007 sup §2.1 9 类(M3.t1-M3.t9) | Phase 4 draft 文本「7 → 9」或加 superseded 标签 — ✅ 已修 (2026-05-28),phase4 L75 / L85 改为「M3.t1–M3.t9 9 类时钟」并附 R1 修订指向 ADR-007 sup §2.1 |
| CONF-5(P1) | Phase 5 §3.3 + 多处「MCA 6 轴」 | ADR-007 sup §2.2 7 轴 | Phase 5 draft「6 → 7」 — ✅ 已修 (2026-05-28),phase5 L60 / L101 + phase4 L205 active 治理表述改为「7 轴」并附 R1 修订指向;L296 / L305 / L307 / L331 桶位表设计耦合,保留 R1 前 6 轴 + L/D/F/N/C/I 列名(重表设计超 P1 范围) |
| CONF-6(P2) | M0 yaml ai-semi-manual-sla.description 写「IAA kappa ≥ 0.7」 | Phase 7 SLA §三表是任务级分级 0.65-0.75 | yaml description 改「IAA kappa 0.65-0.75 任务级分级(见 Phase 7 SLA §三)」 |
| CONF-7(P1) | M0 yaml ai-cognition-schema 输出 cognition/types.py vs cognition-1.1-contract §5 Pydantic 草案文件名 src/finbayes/cognition/contract_v1_1.py vs m0-pack §3.5 用 contract_v1_1_m0.py | 工程落盘约定 src/finbayes/cognition/types.py(与 m0-pack §3 主体一致) | cognition-1.1-contract §5 注释文件名改为 src/finbayes/cognition/types.py — ✅ 已修 (2026-05-28),L146 文件名注释改为 src/finbayes/cognition/types.py |
| CONF-8(无需修) | worst_axis 多桶裁决:mca-classifier §3+§7 vs cognition-1.1-contract §8「本契约不锁定」 | mca-classifier §7(v1 working) | 已诚实标 working,无需修 |
| CONF-9(无需修) | data-splits §6 18 case 桶位映射「v1 起步建议」 | 已标 v1 起步,Phase 5 治理首季评估 | 无需修 |
| CONF-10(P2) | regulation_status ADR-008 sup §2.3「轴 3 = F2/F3 必选」vs m0-pack §3.5 整体 stub | M0 全 Mock fixture 控制 axis_3 = F1 → stub 合规 | m0-pack §3.5 加 1 行注释「M0 Mock 默认 axis_3 = F1 故 stub」 |
6. 链接 / cross-reference 健康度
| ID | 问题 | 修复动作 |
|---|---|---|
| LINK-1(P0) | .archon yaml:94 死链 | 见 CONF-1 |
| LINK-2 | 4 子系统 §8 跨子系统 + 与 EvalHarness 联动段已有 | ✓ |
| LINK-3 | 三 engineering-pack 互引不完整 | 见 INC-3 |
| LINK-4(P2) | architecture-anti-bloat-guard 未被 m0-pack / arch §29 / 4 子系统反向引用 | m0-pack §15 + arch §29 末段补指针(防实施 Agent 跳过守门) |
| LINK-5 | Phase 3 drafts 未声明 source-of-truth-for | 见 RED-2 |
| LINK-6 | ADR-008 sup → ADR-008 主体路径 | ✓ |
| LINK-7(P2) | sync-plan-adr007-supplement.md 未反向指向 4 子系统作为已执行 P0 任务清单 | sync-plan 补 cross-reference |
| LINK-8 | eval-harness-formulas §9 关联资产链接闭环 | ✓ |
| LINK-9 | for-agents/manifest.json + machine-context.json 引用 Phase 7 SLA 路径 | ✓(verify:kb 通过) |
7. 修复优先级总表
P0(阻塞 C-1 启动 / 2 条)
- CONF-1:修
.archon/workflows/milestone-M0.yaml:94anchor_doc 死链 → 改指向governance/workstreams/finbayes-cognition-system-research/drafts/2026-05-28-phase7-semi-manual-annotation-sla.md - CONF-2:ADR-008 sup §1 + §3.1「5 新字段」→「6 新字段」+ product-def L163+L186 同步
P1(强烈建议修,不阻塞 / 7 条)
- CONF-3 / CONF-4 / CONF-5 / CONF-7:「7 桶」「7 时钟」「6 轴」措辞统一 + cognition-1.1-contract §5 文件名同步
- INC-1:4 子系统补「实现里程碑映射」段
- INC-6 / INC-10:M0 yaml 两节点补 related_pack
- INC-7:topic agent-pack.yaml sources 补 3 项
P2(优化 / 12 条)
- DUP-1/3/4/5:4 子系统接口段去字段细节重列
- RED-1/2/3:drafts frontmatter 加标签 + m0-pack §3 加 status 注释
- RED-6:arch §29 末段改为指针
- INC-2/3/4/5/8/9:互补 cross-reference
- CONF-6/10:yaml description + m0-pack §3.5 注释微调
- LINK-4/7:anti-bloat-guard + sync-plan 反向指针
8. 决策建议
可以启动 C-1(EvalHarness M0 schema 实施),但 P0 两条必须先关掉:
- CONF-1:实施 Agent 一旦尝试加载
ai-semi-manual-sla.inputs.anchor_doc立即 404,会卡ai-semi-manual-sla节点不能开工 - CONF-2:实施 Agent 读 ADR-008 sup §1 / §3.1 看到「5 新字段」会与 cognition-1.1-contract / m0-pack §3.5 / product-def §7.3 表「6 字段」不一致,造成 Pydantic schema 字段数校验不通过 / 实施者疑惑
P0 预计 30 分钟工程量(2 文件 3 处 edit),直接落手,不起新 ADR;修完跑 npm run verify:kb 即可启动 C-1。P1 7 条建议 C-1 期间并行修;P2 12 条推迟 M0 收尾盘点(参见 anti-bloat-guard §4)。
9. 排查方法论自检 / 不足
- Phase 7 SLA §四
sla-breachedfallback 路径未深读 —ai-semi-manual-sla节点遇边界问题可能需要回 Phase 7 SLA §四追读 - Phase 6 R-A / R-B / R-C reviews 资产 11 份未逐一比对(通过 ADR-007 sup / Phase 4-5 / 4 子系统的 R 收口标签交叉验证,未发现新冲突,但未做穷尽 review)
- legacy
projects/finclaw/未排查(与 FinBayes 工程化范围不相关) - 18 case Phase 2 个案报告未逐一与 data-splits §6 表交叉验证(通过 Phase 3 case-calibration-summary + data-splits §3 间接验证)
- ADR-008 主体(1.0)vs ADR-008 sup(1.1)差异表 §3「10 要素契约全部保留」未逐字段验证(通过 cognition-1.1-contract / m0-pack §3 主体字段清单间接验证)
.archonruntime state 不在排查范围(runtime / state 不进本仓约定)