跳到主要内容

Q4 治理库深度整合 · 审计与收口结论

⚠️ 2026-05-31 后续更新(结论已被 owner 决策取代):本审计"物理重构非必要"的判断基于"维持 evaluation/ 现状"的前提。owner 此后决定新建独立知识库 commons/frameworks/finteceval/ 替换 evaluation/,并已执行:散落文档集中重构 + FinClaw(FinBayes 前身)整合升级 + mermaid 可视化。故下文"不做物理重构"的建议已被取代;而"维度计数事实源由 contracts/ 治理、架构 §21 旧 8 维归 arch-rewrite 线"等技术结论仍有效。本文保留作决策演进记录。

承接 FinTecEval 四问中的 Q4(治理库整理/清理/整合/重构)。P0–P5 已完成指针级 SSOT 收口;本轮做"深度整合"的精确审计,结论是:大部分"深度重构/清 stale 计数"既非必要、亦非 FinTecEval 评测引擎线的职权范围——计数事实源已被 FinBayes contracts/ 层治理,残留 stale 是已登记的跨线 L3 冲突。本文记录审计依据 + FinTecEval 侧已闭合项 + 跨线交接。

1. 审计范围与方法

对治理库全量 .md 审计评测相关计数描述(认知机制数 / MCA 轴数 / MCA 桶数 / 评测维度数),核对是否存在"散落不一致"。

2. 关键发现:计数已统一,事实源已治理

2.1 当前文档计数是一致的(非散落)

ADR-007 supplement(2026-05-28 accepted)锁定的"五件套"在所有当前文档中表述一致:

  • 8 机制(M1–M8) · MCA 7 分轴 · S1 横切子流程 · 11 维评测(D1–D11) · 7 MCA 桶(8 label,B5 拆 B5a/B5b) · Phase 5 治理
  • 一致出现于:ecosystem/glossary.md §246、projects/finbayes/strategic-whitepaper.md §351/§1301、projects/finbayes/engineering/product-definition.md §297-300、.../subsystems/{README,eval-harness,mca-classifier,knowledge-graph-service}.md.../engineering/README.md 等。

2.2 计数的机器可读事实源 = contracts/(已治理)

contracts/ 是 FinBayes 架构的 schema 单一事实源层(Step 11 整改包 I)。其中:

  • contracts/evaluation-dimensions.yaml = 11 维评测 D1–D11 权威;
  • contracts/mca-buckets.yaml = 7 分轴 + 8 桶 label 权威;
  • contracts/README 明示"冲突时以 contracts/ 为准",且 contracts/ 自身变更走 change-protocol L3

2.3 "stale 计数"的真实性质(非 FinTecEval 待办)

早期 STATE 备注的"清 13 处 stale 计数(8 维 vs 11 维)"经核实,分三类、均非 FinTecEval 评测引擎线应擅自改动

类别实例性质归属
已登记的被覆盖冲突架构主稿 §21「旧 8 维 rubric」vs §29/ADR-007 的 11 维contracts/README §29 已登记为已知冲突,contracts/evaluation-dimensions.yaml 覆盖FinBayes arch-rewrite 线 L3(contracts/ 演化流程)
正确标记的历史strategic-whitepaper.md §349「6 机制…是 ADR-007 当时的 working 骨架…保留在此」;briefs §56「替代…working 骨架 6 机制」故意保留的演进史,非 stale 错误保持(不动)
学术框架引用briefs「UniFinEval 7 维度 + FinEval 6 支柱」外部框架正确引用,与 FinBayes 自身计数无关保持(不动)

不存在散落在 FinTecEval 评测 commons 里的 stale 计数commons/frameworks/evaluation/{shared,finbayes,finclaw} 的计数(本体 10 维 / D1–D11 / V1–V3)均正确。

3. FinTecEval 侧已闭合项(本轮唯一 in-bounds 动作)

commons/frameworks/evaluation/finbayes/README.md §2A 分层 SSOT 指针补全机器可读计数事实源:新增指向 contracts/evaluation-dimensions.yaml + contracts/mca-buckets.yaml,并显式声明"架构 §21 旧 8 维是 contracts/ 已登记的被覆盖冲突、归 arch-rewrite 线、非本评测框架口径"。这样评测框架的指针 SSOT 链路接到权威计数层,杜绝下游误引旧 8 维。

verify:kb:本轮改动后跑 npm run verify:kb 应全绿(纯附加指针,无 /Users 路径、frontmatter 完整)。

4. 跨线交接(不越权)

  • 架构主稿 §21 旧 8 维 rubric 的物理整改/标 deprecated:属 FinBayes arch-rewrite 线对 contracts/-治理文档的 L3 工作(已在 contracts/README §29 + adr-states.yaml 跟踪)。FinTecEval 作为评测引擎线不擅自改动他线架构主稿,仅在评测 commons 指针处声明权威源,并在此交接。
  • Phase 4 评测定义归并/指针化:评测维度定义的 SSOT 已是 eval-harness-formulas.md(公式)+ contracts/evaluation-dimensions.yaml(计数)+ ADR-007 supplement(语义),三者已互链。无需再"归并"——归并会制造重复定义、违反 contracts/ 单源原则。

5. 收口结论

  • Q4 的"指针级 SSOT 收口"已完成(P0–P5 + 本轮 §2A 补全)。
  • Q4 的"物理深度重构/清 stale 计数"经审计判定为:非必要(计数已一致)+ 非本线职权(contracts/ 治理 + arch-rewrite 线 L3)。强行重构会与 contracts/ 单源设计冲突、且越权改他线主稿。
  • 故 Q4 在 FinTecEval 侧收口于"指针接到权威源 + 跨线交接声明",不做物理重构。

6. 边界

  • 本文为 workstream 操作性记录(非协议变更)。§3 的 README 指针补全为纯附加 L2、在已批准的本工作流授权内;由 owner 评审后合入。
  • 零删除、不动他线主稿、不改 contracts/