跳到主要内容

Phase 5 · FinBayes 金融认知体系迭代方法论与治理机制(v1 草案)

Phase 1–3 给出 v1 体系(8 机制 + MCA 6 轴 + S1 横切子流程 + 14 case 反向校准)(R1 修订后升为 7 轴,含 K 货币与跨境约束轴,详见 ADR-007 supplement §2.4),Phase 4 给出评测体系,Phase 5 回答"v1 之后如何继续演化、谁能改、走什么流程、怎么防退化"。所有阈值与流程参数标"建议 v1,留 Phase 6 review 校准"。沿用 ADR-009 立场降级 audit trail 范式。

一、迭代节奏

两层节奏并行,与 Phase 4 评测对齐:季度全量评估(每季末跑全量评测 + 滚入新 case,输出"机制 × MCA 桶"覆盖率矩阵 + 退化告警 + 待立项清单)、月度增量评估(滚动登记用户反馈与新 case,不做机制级修订)。

vN→vN+1 升级触发三选一:(a)某 A 级候选累计 ≥ 3 case 跨 ≥ 2 MCA 桶;(b)某机制连续两季覆盖率下降;(c)出现 8 机制原型无法吸收的新场景类。

不变项——8 机制结构、4 带耦合、"先尝试装回原型"原则、ADR-007 核心契约——修订须 L4 ADR + 7 天公示;可演化项——子机制清单、MCA 等级阈值、S1 内部步骤、规律不适用降级路径、案例库注释规范——走 L2 / L3。不变项的"降级"也以 audit trail 记录,不静默改动。

二、迭代触发源(4 类)

四类触发源在月度账本统一登记、季度全量统一裁决,优先级平等但证据门槛不同。

  • A · 评测体系缺口:Phase 4 覆盖率掉档 / MCA 桶系统性偏差 / 退化告警。单一来源可立项 B 级,跨 ≥ 2 MCA 桶可立项 A 级。
  • B · 用户实战反馈:个人投资者使用产品时的认知失效 case。门槛:同一缺口 ≥ 3 独立用户独立反馈,或单一反馈附第三方可验证证据链。过滤准则见 §7。
  • C · 业内方法论演进:学术 / 业内新框架 / 新数据源。原始材料先入 commons/references/,显式映射到现有 8 机制 / MCA / S1,给出"装回原型 vs 需扩展"判定。
  • D · 金融市场新场景:新金融产品 / 新危机模式 / 新市场结构(RWA / carbon market / 地缘金融分隔)。需 ≥ 1 次完整 case 反向校准方进入 A 级候选。

账本字段(建议 v1):{trigger-source, raised-by, raised-date, candidate-target, mca-bucket, evidence-strength, proposed-level}

三、治理流程

按变更对象分类,最终走 governance/change-protocol.md 对应级别。

3.1 机制级变更(M1–M8 子机制增删 / 修订):A 或 B 级证据成熟 → mechanism-patch 草稿 → workstream mini-review → reviewer + 工程团队联合评审 → L3(不触 ecosystem 口径)或 L4(触 ADR-007 核心契约)。每次变更在 ADR-007 supplement 后续 patch 段追加"修订记录"。

子机制新增 / 拆分门槛:≥ 3 独立 case 触发且不能被现有同机制下的子机制吸收(R1 修订:原 ≥ 2 case,R-C 评测视角 review 指出偏松会引发子机制清单膨胀,与 §7"防机制清单膨胀"自相矛盾。R1 提到 ≥ 3 case,使子机制门槛 < 机制扩展门槛但 > MCA 阈值调整门槛,保留三档梯度治理一致性)。

3.2 机制清单扩展(8 → 9+):沿用 Phase 2「3:1 否决 M9」范式。

v1→v2 过渡窗口(建议 v1,T0 → T0+12 月)门槛R1 修订:原"≥ 5 case 跨 ≥ 3 桶"被 R-C 评测视角 review 指出,因 MCA B6 / B7 桶起步零样本,跨 3 桶门槛在 v1→v2 窗口内事实上不可达,等于"不可能扩展"。R1 降级为过渡门槛):

  • (a)≥ 4 独立 case 触发且现有 8 机制 + MCA + S1 均无法吸收(原 ≥ 5);
  • (b)跨 ≥ 2 MCA 桶 + ≥ 1 pending 桶证据(原跨 ≥ 3 桶,pending 桶证据作为补充条件防止纯发达市场样本继续单边扩展);
  • (c)"装回原型路径"全部失败。

v2 之后稳态门槛(恢复原阈值,防 v1→v2 降级形成长期路径依赖,避免 vN→vN+1 普遍降门槛):

  • ≥ 5 独立 case 触发;
  • 跨 ≥ 3 MCA 桶;
  • "装回原型路径"全部失败。

R1 修订:v1→v2 降门槛仅适用于过渡窗口,v2 之后必须回到 ≥ 5 case / ≥ 3 桶。门槛降级与样本桶位起步零状态绑定,一旦 Phase 6 R1 P1-3 + 季度补 case 提升至每桶 ≥ 20 case 起步,过渡门槛自动失效。整体治理流程一致性约束:vN→vN+1 不能形成"普遍降门槛"惯例,过渡窗口属一次性结构性补偿而非循环宽松。

流程:候选 → 显式枚举装回失败理由 → reviewer 并行评审(reviewer 各自独立给意见,不再串联会签)→ 单点签署(生态发起人或其指定的 reviewer 子组单点签字)+ 14 天异议期(任一 reviewer / 工程团队 / 用户社区可在 14 天内提出异议触发再评审)+ reviewer 3:1 多数否决仍保留 → 通过则 L4 ADR 落地。默认偏向"不扩展"。

R1 修订:原"生态发起人 + ≥ 2 reviewer + 工程团队负责人三方联合签署 + 7 天公示"被 R-C 评测视角 review 指出串联节点过多,对个人投资者团队规模会成为瓶颈。R1 调整为「并行评审 + 单点签署 + 14 天异议期 + 3:1 否决」——评审环节并行而非串联(reviewer 各自独立出意见而非会签);签署收敛到生态发起人或其指定子组的单点;公示期由 7 天延长至 14 天的异议期作为补偿,任一方异议触发再评审;3:1 否决权保留作为多数共识硬约束。整体效果是缩短串联路径、保留共识门槛,治理流程一致性得以维护——签署权集中但异议权扩散,否决权仍是 3:1 多数。

3.3 MCA 分轴变更:增删轴须 ≥ 3 case 证据且不能被现有 7 轴吸收(R1 修订前为 6 轴;R-A P0-2 已立轴 7「货币与跨境约束」,详见 ADR-007 supplement §2.2),走 L3;调整等级阈值须 ≥ 2 case 表明现阈值导致系统性误诊,走 L2 + 附 Phase 4 前后对比。轴 8(ESG 与气候政策)候选已在 Phase 3 T2 §5 预留。

3.4 横切子流程变更:S1 内部失败模式调整走 L2;新增横切子流程(S2 / S3 …)与机制扩展同门槛——v1→v2 过渡窗口 ≥ 4 case 跨 ≥ 2 桶 + 1 pending 桶证据,v2 之后稳态 ≥ 5 case 跨 ≥ 3 MCA 桶且不能装回 S1,走 L3。默认偏向"先装回 S1 / 子机制"。

3.5 C 级 pending 项升级路径(S19 / S3 / S6 / M7.meta 峰终):

  • pending → B 级:≥ 3 case 跨 ≥ 2 MCA 桶;
  • B 级 → A 级:≥ 5 case 跨 ≥ 3 MCA 桶,或单一锁定级证据;
  • 降级路径(沿用 ADR-009 范式):连续 ≥ 4 季度无新证据则进入"冷藏"(不删除,停止主动评测),走 L2。R1 修订兜底:冷藏判定加"非样本不足"兜底——若 ≥ 4 季度无新证据但同期对应 MCA 桶的样本总量仍少于 20 case(即可归因于桶位样本不足而非 pending 项本身无价值),冷藏判定推迟至该桶样本补齐后再裁决;只有"桶位样本已 ≥ 20 case 但 pending 项仍无新触发"才进入正式冷藏判定。防止 B6 / B7 等起步零样本桶上的 pending 项(S19 / S3 / S6 / M7.meta 峰终)在 T0+12 月窗口内因结构性桶位空缺而被一次性清零。

R1 修订:原冷藏判定"连续 ≥ 4 季度无新证据"被 R-C 评测视角 review 指出,对应到当前 4 个 pending 项会在 T0+12 月几乎全部冷藏(因为对应 B7 桶样本来不及补齐),等于结构性把 pending 项清零。R1 加"且不能因桶位样本不足导致"的兜底,保留 pending 项在桶位补齐前的存续。

四、案例库管理

案例库是迭代核心数据资产,与评测体系共享底层 schema。

增添流程:提交候选 → 工程团队"事实层 + 8 机制可观测性"初评 → reviewer"洞察可证伪性 + MCA 桶归类"复评 → 入库判定(accepted / pending-evidence / rejected)→ 下季度进入评测样本。

季度补 case 规模R1 修订):每季度补 15-20 case(原建议 v1 为 5-10)。R-C 评测视角 review 指出 5-10 / 季度对每桶 20 case 起步目标的 7 维度 × 7 桶 × 多模式统计显著性需求不足——一年 20-40 case 增量仅维持 72% 覆盖率现状无法承载评测体系。R1 提到 15-20 / 季度,年 60-80 case 增量,恰好可在 v1→v2 过渡窗口(T0+12 月)把 B6 / B7 / B5 等起步零 / 低样本桶补至 ≥ 20 case,使 R-C 提出的 MCA B5/B7 桶质量问题与 P0-3 pending 冷藏兜底解锁条件同步达成。

标注规范(建议 v1 字段):{case-id, time-window, mca-bucket, ground-truth-narrative, key-insights, mechanism-triggers (M1–M8), signal-triggers (S1–S19 + 概念因子), cross-mechanism-subflow-triggers, data-source-confidence, contested-points}。其中 contested-points 显式登记 reviewer 之间未达成一致的判定项作为 audit trail。

与评测体系的关系:案例库 = 评测样本全集;评测按 MCA 桶分层抽样。两者解耦——案例库治理偏"事实与洞察沉淀",评测治理偏"指标与基线"——分别走不同评审节奏但共享底层数据。

治理者:三方协作。工程团队负责技术维护;reviewer 负责洞察评审 + 标答制定;用户社区负责实战反馈 case 提交(用户主权三件套保障下)。三方分歧记入 contested-points 不强制收敛,作为 Phase 6 review 输入。

五、责任与角色

  • 工程团队(实现层):8 机制 + MCA + S1 工程实现迭代、评测体系执行、案例库技术维护、月度 / 季度评估组织。无独自拍板机制级变更权限,但有"流程否决权"。
  • 金融领域专家 reviewer(知识层):季度机制覆盖度评审、案例库洞察评审 + 标答制定、业内方法论演进跟踪、跨 case 规律提取。多名 reviewer 分歧按"3:1 多数"判定;不足 3 名时由生态发起人补位。
  • 用户社区(实战反馈层):认知失效 case 提交、输出形态可操作性反馈、C 级 pending 项"在地"证据补充。不直接参与机制级拍板,但是触发源 B 的法定来源。在用户主权三件套保障下,反馈保留原始表述与脱敏上下文不被单方面改写。

三方分歧裁决:实现细节(接口 / 字段 / pipeline)→ 工程团队拍板,reviewer 保留 audit trail 反对意见;机制定义 / 子机制存废 / MCA 阈值 → reviewer 多数票拍板,工程团队执行但保留实现层 escape hatch;体系扩展边界 → §3.2 并行评审 + 单点签署 + 14 天异议期 + 3:1 否决(R1 修订;原"三方联合签署"调整为并行 + 单点 + 异议期,详见 §3.2 R1 修订段),3:1 否决票仍是多数共识硬约束。

六、与上位 / 平行工作流的接口

  • 与 v3 战略白皮书 / ADR-007 的关系:v3 定义不变量与商业边界(L1),ADR-007 把认知体系定为 v3 的 L1 资产(accepted-pending-research)。本工作流 Phase 1–5 产出经 L4 ADR 合并写回 ADR-007 正式段后,状态升为 accepted-formalized。Phase 5 治理机制是 ADR-007 正式段的一部分,非外挂。
  • 与 finbayes-whitepaper-v3-downstream-sync L2 sync 工作流的接口:本工作流向 sync 工作流提供"机制 → 子系统 → 接口契约"最小映射表;由 sync 工作流负责填充 L2 产品定义 / L3 架构细节。
  • 与产品定义 / 架构层的关系:认知体系是 L1 资产,L2 把 8 机制翻译为用户任务族,L3 把 8 机制翻译为可独立部署子系统。下位不得违反上位(机制契约、MCA 轴位语义、S1 输出字段);反向修订须经本工作流而非下游单方面改动。

七、防退化机制

  • 防"评测分数好看但能力退化":评测分桶按 MCA 7 轴(R1 修订前为 6 轴,详见 ADR-007 supplement §2.2)+ 时间窗双重分层,禁止全集平均掩盖局部退化;新 case 入库须做"上轮 vN 体系冷启评测"作为基线对照避免过拟合;定期(建议每 4 季度)抽 ≥ 20% case 作 holdout 仅作年度抽检。
  • 防"机制清单膨胀":默认偏向"装回原型"。机制扩展门槛 > 子机制扩展门槛 > MCA 阈值调整门槛,三档梯度(R1 修订:原文"机制扩展 5 case vs 子机制扩展 2 case"梯度差被 R-C 指出偏松。R1 后子机制提至 ≥ 3 case,机制扩展 v2 之后稳态仍 ≥ 5 case,v1→v2 过渡 ≥ 4 case + pending 桶证据。三档梯度差仍清晰:v2 稳态 5 → 3 → 2 case,过渡 4 → 3 → 2 case,依然保留量级差,避免子机制清单膨胀)。任何"新增 M9 / S2"提案须显式枚举装入现有结构的失败路径;reviewer 子组保留 3:1 否决权。
  • 防"路径依赖":Phase 1–3 判定不锁死后续修订。每次季度全量含"是否降级或撤回 vN-1 决议"环节(沿用 ADR-009 范式);audit trail 保留 ≥ 8 季度备追溯;reviewer 与工程团队均可发起降级提案。
  • 防"用户反馈被噪音淹没":触发源 B 反馈进账本前过滤,准则(建议 v1)三选一:(a)≥ 3 独立用户独立反馈同一缺口;(b)单一反馈附第三方可验证证据链;(c)反馈可映射到 8 机制 / MCA / S1 具体位点(非泛泛"产品不好用")。不满足者进入"低优先级观察池"季度统一回看。

八、v1.0 → 第一次正式 review 时间线(建议 v1)

  • T0(v1 落地):Phase 1–5 经 L4 ADR 合并写回 ADR-007 supplement,状态升为 accepted-formalized;同步建立月度账本 + 案例库 v1 schema + Phase 4 评测 pipeline v1。
  • T0 + 1 月:第一次月度增量评估,跑通账本流程 + 登记首批用户反馈与新增 case 候选。
  • T0 + 3 月:第一次季度全量评估,跑通评测全量 pipeline + 产出"机制 × MCA 桶"覆盖率矩阵 + 登记 C 级 pending 新增证据。
  • T0 + 6 月(建议 Phase 6 启动):第一次正式 review。覆盖(a)8 机制 v1 实战覆盖率;(b)MCA 6 轴是否出现轴 7 / 轴 8 升级证据(R1 修订后升为 7 轴,含 K 货币与跨境约束轴,详见 ADR-007 supplement §2.4);(c)S1 是否需调整失败模式;(d)C 级 pending 升降级裁决;(e)治理流程本身的可操作性反馈(所有"建议 v1"是否需校准);(f)防退化机制是否有效;(g)三方分歧实际记录与裁决回看。
  • T0 + 12 月(建议 v1 → v2 升级窗口):若 T0 + 6 月 review 产出 ≥ 1 项 A 级调整候选,启动 v1 → v2 升级;否则维持 v1 滚动演化。

关联

  • Phase 1 D1 8 机制锁定:drafts/2026-05-28-framework-to-mechanism-mapping.md
  • Phase 2 14 case 反向校准 + final-synthesis:drafts/2026-05-28-phase2-case-*.md / reviews/2026-05-28-phase2-final-synthesis.md
  • Phase 3 T1–T5:drafts/2026-05-28-phase3-*.md / reviews/2026-05-28-phase3-mini-review.md
  • 变更协议:governance/change-protocol.md
  • 文档工作流 meta-playbook:commons/playbooks/document-workflows-meta-playbook.md
  • ADR-007 working / ADR-009 立场降级范式:见 governance/decisions/(formalize 后回填)

Phase 6 R1 修订记录

本节按 Phase 6 R1 综合判定(reviews/2026-05-28-phase6-r1-synthesis.md)执行,对应必修项 P1-5

修订项:R-C 评测视角 review 提出的 5 项治理门槛调整,全部在本版本落地。

修订 1 · v1→v2 机制扩展门槛降级(§3.2)

维度原 v1R1 修订
case 数≥ 5v1→v2 过渡 ≥ 4;v2 之后回到 ≥ 5
MCA 桶跨度≥ 3v1→v2 过渡 ≥ 2 + 1 pending 桶证据;v2 之后回到 ≥ 3

R-C 触发理由:因 MCA B6 / B7 桶起步零样本,跨 3 桶门槛在 v1→v2 窗口内事实上不可达,等于"不可能扩展"。

治理一致性约束:降级仅限 v1→v2 过渡窗口(T0 → T0+12 月)+ 桶位补齐前;v2 之后自动恢复 ≥ 5 case / ≥ 3 桶稳态门槛,vN→vN+1 不能形成普遍降门槛惯例,过渡窗口属一次性结构性补偿。"+1 pending 桶证据"约束防止纯发达市场样本单边扩展。

修订 2 · 子机制扩展门槛提升(§3.1 + §7)

维度原 v1R1 修订
case 数≥ 2≥ 3

R-C 触发理由:≥ 2 case 偏松,会引发子机制清单膨胀,与 §7"防机制清单膨胀"自相矛盾。

治理一致性约束:保留三档梯度——v2 稳态机制扩展 5 case > 子机制 3 case > MCA 阈值调整 2 case;v1→v2 过渡 4 → 3 → 2 case,量级差仍清晰。

修订 3 · 三方签署改为并行 + 单点 + 异议期(§3.2 + §5)

维度原 v1R1 修订
评审模式串联(三方联合签署)并行评审(reviewer 各自独立出意见)
签署生态发起人 + ≥ 2 reviewer + 工程团队负责人三方联合生态发起人或指定子组单点签署
公示 / 异议7 天公示14 天异议期(任一方异议触发再评审)
多数共识3:1 否决3:1 否决(保留)

R-C 触发理由:串联节点过多,对个人投资者团队规模成为瓶颈。

治理一致性约束:签署权集中但异议权扩散,否决权仍是 3:1 多数——共识门槛未降,只缩短串联路径。

修订 4 · 季度补 case 规模提升(§4)

维度原 v1R1 修订
季度增量5-1015-20

R-C 触发理由:5-10 / 季度对每桶 20 case 起步目标的 7 维度 × 7 桶 × 多模式统计显著性需求不足,72% 覆盖率无法提升。

治理一致性约束:15-20 / 季度 = 年 60-80 case 增量,恰好与 v1→v2 过渡窗口的桶位补齐目标对齐,解锁本次修订项 1 / 5 的过渡条件。

修订 5 · pending 冷藏加"非样本不足"兜底(§3.5)

维度原 v1R1 修订
冷藏触发连续 ≥ 4 季度无新证据 → 冷藏同左 + 兜底:若对应 MCA 桶样本总量 < 20 case,冷藏推迟至该桶补齐
正式冷藏判定即时仅"桶位样本已 ≥ 20 case 但 pending 项仍无新触发"才进入正式冷藏

R-C 触发理由:原冷藏判定对应到当前 4 个 pending(S19 / S3 / S6 / M7.meta 峰终)会在 T0+12 月几乎全部冷藏(因 B7 桶样本来不及补),等于结构性清零。

治理一致性约束:兜底仅在桶位样本不足时延后冷藏,不改变 ADR-009 立场降级范式整体逻辑——桶位补齐后冷藏门槛仍是 ≥ 4 季度无新证据。

整体治理流程一致性自检

一致性维度自检结果
vN→vN+1 普遍降门槛风险✅ 不存在。降门槛仅限 v1→v2 过渡窗口 + 与桶位补齐绑定,v2 之后自动恢复稳态
三档梯度(机制 > 子机制 > MCA 阈值)✅ 保留。v2 稳态 5/3/2,过渡 4/3/2
多数共识 3:1 否决✅ 保留。签署模式调整不影响多数共识硬约束
防机制清单膨胀(§7)✅ 加强。子机制门槛由 2 提至 3 case,与原"5 case vs 2 case"梯度差矛盾的问题被修正
ADR-009 立场降级范式✅ 沿用。pending 冷藏兜底仅延后判定,不改变降级逻辑
与 Phase 4 评测体系 / Phase 6 R1 P0-3 的协同✅ 季度 15-20 case + pending 冷藏兜底 + MCA 桶位补齐三项共同解锁 R-C P0-3 评测硬缺陷修订条件

与其它 R1 修订项的跨文档协同

  • 与 P0-2 MCA 轴 7 立项联动drafts/2026-05-28-phase3-market-context-axis.md R1 修订):轴 7 立项后 MCA 由 6 轴扩为 7 轴,B7 桶(EM 主权 / 货币危机)将以轴 7 K3 为核心识别键值,本次治理修订的"15-20 / 季度补 case"主要补 B7 桶样本。
  • 与 P1-1 S1 模式 d 立项联动drafts/2026-05-28-phase3-narrative-numbers-consistency.md R1 修订):模式 d 新增"跨准则口径不可比",案例库扩充阶段需专项补"跨准则对照"case 作为模式 d 反向校准锚。
  • 与 P1-3 14 case 扩充联动:L7 / L2 / L9 / L13 至少 4 case 同时是轴 7 / 模式 d 的反向校准锚 + B7 桶起步样本,本次治理修订的季度 15-20 case 应优先消化 P1-3 候选清单。