认知数据独立性 + 护城河 · 对齐冻结草案
本文是什么:2026-05-30 owner ↔ 主控就"FinBayes 认知与外部数据/模型的关系"做了一轮深度对齐,本文把已达成共识冻结为单一可审源,防
/compact丢失。它本身不是上位文档——共识确认后按 §8 落地图分步传导到战略不变量 / 产品定义 / 架构 / 综合层规范,硬度待 owner 拍。触发:M0 L8 not-confirm → R1a prompt 整改 → 与竞品 FinClaw 同条件(gpt-5.5 / 无外部数据 / 无记忆画像)两轮对照(标的交易类 + 纯认知类)→ 暴露"R1a 内容其实不弱、差在表达 + 无护城河"→ owner 系列澄清,逼出本框架。
§1 主轴:FinBayes 内部 vs 外部
从 FinBayes 自身视角划界(owner 2026-05-30 拍定):
| 侧 | 内容 | 代号 |
|---|---|---|
| 内部(自有认知) | 认知体系(推理方法/结构)+ 金融知识库 + 金融经验库 +(远期)自有金融专家模型 | C |
| 外部 | ① 全部数据/信息——不分来源/通道:用户本地上传(K 线图 / 内部研报 / 文本)与第三方 API / 搜索 / Data Horizon 一视同仁,对 FinBayes 都是外部 | A |
| ② 借来的通用模型(在被 C 内化前都算外部/借来的) | B |
关键认知(owner 纠正):用户本地上传的数据/信息也是 FinBayes 的外部数据,与第三方源在原则上一视同仁;"用户上传 vs API" 只是 A 的工程子轴(§5),不是主轴。
§2 三个正交目标 G0 / G1 / G2
| 目标 | 定义 | 关于 | 性质 | 现状 |
|---|---|---|---|---|
| G0 表达 | 易读 / 活人感 / 干货无废话,符合综合层认知输出规格 | 出口(与 A/B/C 无关) | 交付质量 | 缺渲染层(R1c 未做) |
| G1 鲁棒 | 认知不强依赖任何外部数据 A(任何来源/通道);A 一律是辅助证据(完善 / 矫正 / 佐证),永不是前提 | 独立于 A | 设计不变量(可测、近二元) | 内容层 C5/C6 已达标 |
| G2 护城河 | 认知质量从借来的 B 逐步迁到自有 C | 跨 B→C | 战略 / 竞争(渐进、长程) | ≈0% 下水 |
这取代了早先含糊的"T1/T2 两档独立性"——它们性质不同(鲁棒性 vs 护城河),不应并列成一根轴。
§3 G1 的工程化判据:数据消融 gate(避免停在抽象)
同一批 case,按证据通道分模式跑,G1 成立当且仅当:
- 核断言(抽掉全部 A):
- 仍过规格 §9(高质量有条件认知 + 诚实标缺口);
- 数据精修层不伪造——
posterior/s1/mca_bucket/ 具体数字 要么缺省、要么显式标"未拟合(无证据)",绝不假填; - 认知核预先枚举出"证据来了会改变什么"的槽位(成立 / 失效条件、缺口),使带证据时是对这些已声明槽位的 resolution,而非引入认知核从未预告的新主因。
- 能力断言(按 A 子轴分项,不污染原则):A 经"用户上传"通道(图 / 文档 / 文本)提供时,能真正读进并用于判断,且离线时不偷连外部源。
价值:可证伪、可建成评测维度("数据消融鲁棒性")。核断言第 2 条当场判了 M0 假填违规(见 §7)。
§4 G2 护城河 = 必要合取集(认知体系为脊柱)
非单一充分条件,是一组缺一不够的组件:
| # | 组件 | 方法 / 内容 |
|---|---|---|
| 1 | 认知体系(MCA / S1 / 8 机制 / 贝叶斯更新 / 任务-字段组合) | 方法为主——怎么想 |
| 2 | 金融知识库(事实 / 框架 / 关系,可下载升级迭代) | 内容——知道什么 |
| 3 | 金融经验库(case 校准 / 判断记录 / 成败复盘) | 内容——学到什么 |
| 4 | 认知表达规范(= G0) | 交付——怎么说 |
| 5 | 评测 + 迭代体系(适应度函数驱动的自改进闭环) | 元能力——会变好 |
| 6 | (远期)自有金融专家模型 | 把 1–3 内化进权重 |
认知体系是脊柱:它既作为方法运行,其被 codify 的部分(MCA 轴定义、8 机制、S1 规则)本身就是知识库的核心内容——方法与内容在脊柱处重叠,这是 FinBayes 的特征:推理方法本身是一种可沉淀的金融知识。
诚实基线:在同条件对照里 G2 集合 ≈0% 下水(MCA/S1/posterior 假填、无知识库注入、质量全来自 gpt-5.5),这正是 FinClaw 能打平的原因。
§5 A 的工程子轴(预留接口、不污染原则)
| 子轴 | 取值 | 影响 |
|---|---|---|
| 通道 / 连通性 | 用户上传(离线) / 第三方源(联网) | 安全 / 内网可用性 |
| 模态 | 文本 / 图(K 线) / 文档(PDF) / 多模态 | 需多模态摄入 + 多模态模型(B) |
| 时序 | 一次性 / 持续跟踪 | 需会话 + 结构化记忆 |
两个必须支持的场景(owner 提)归位:① 仅接一个(可能本地部署)模型、上传 K 线图求分析;② 上传组织内部非公开研报 + 持续多模态跟踪/update。二者都是 "A 经用户上传通道进、外部源被切断":G1 统一处理(不要求、但提供则充分吃进);通道 / 模态 / 时序按子轴实现。
现在留接口、later 实现:多模态摄入 + 持续跟踪是 M1+;离线由 provider 抽象已支持。原则层只认 C / A / B,子轴是 A 的实现细节,绝不上提到原则。约束:场景①需多模态模型,组织本地部署模型未必多模态——场景前提要标明。
§6 两条线(防误判 M0 节奏)
- M0 的 L8 门槛 = "像不像 FinBayes、有没有活人感" → R1a + R1c 在借来的 gpt-5.5 质量上即可达。
- 赢 FinClaw / 有护城河 = 需 G2 集合下水 → M1+/M2。
M0 不需要、也还不可能赢 FinClaw;M0 只需过 L8。 两条线分开,整改节奏才不乱。
§7 由本框架直接掉出的行动项
| 项 | 内容 | 归属 |
|---|---|---|
| R1b 相邻小修(已纳入 M0,owner 拍) | 无真实证据时 posterior / s1 / mca_bucket 诚实标"未拟合(无证据)",停止假常量填充(违 §3 核断言 2) | M0 整改 |
| R1c 渲染层(= G0) | 把认知核 + 结构化字段渲染成可扫读用户面(先最松放开、再最小化约束 —— owner 定的渲染哲学) | M0 整改 |
| 评测加"数据消融鲁棒性"维度 | 把 §3 gate 接入 eval harness | M1 |
| 认知体系真正下水(MCA/S1/posterior 真算) + 知识/经验库注入 | G2 起步 | M1+ |
§8 codify 落地图(硬度待 owner 拍)
| 内容 | 候选上位落点 | 硬度 |
|---|---|---|
| G1 + 内外主轴 + 数据为辅助证据 | 战略不变量 codify(I 系列) 或 产品定义定位段 | P0 / 中 |
| 认知核 vs 数据精修层分离 + 优雅降级 + 禁假填 + 证据通道接口预留 | 架构补充 + 规格 §9 | 工程 / Layer 0 |
| "认知核数据独立"作为 §9 判据 + 数据消融 gate | 综合层认知输出规格 §9 + eval | Layer 0 |
| "离线 + 多模态 + 吃用户自带证据"= 机构 / 内网差异点 | 产品定义定位段 | 定位 |
| G2 护城河集合(认知体系 / 知识库 / 经验库 / 评测迭代 / 自有模型) | 战略路线图 / 架构远期 | 战略 |
注:本框架不属于 ADR-009(那是 prompt 版本化机制);它的家在战略 / 产品 / 架构 / Layer 0 规格。传导走
governance/change-protocol.md,P0 项需 owner 签字。
§9 实证依据(同条件对照,本地运行)
- 方法:FinClaw 降级到与 M0 同条件(gpt-5.5 / 零工具 / 无记忆画像,零工具经运行时 monkeypatch,配置字节级无损恢复);FinBayes 用 R1a(gpt-5.5)。
- 批一(标的 / 交易类 5 题):实质相近,FinBayes 输在排版 / 决断 / 钩子;FinClaw "更具体"部分来自替用户拍执行参数(越 §3 边界)。
- 批二(纯认知 / 理论类 6 题,无需数据):FinBayes 认知不弱反深(C5 贝叶斯 / C6 反身性的多视角 + 反方达职业级),差距 100% 在呈现——最强内容困在 JSON 未渲染。
- 共同结论:同条件下两边质量主要都来自 gpt-5.5 → 印证 §4"护城河 ≈0% 下水";prompt 触顶,下一杠杆是 G2。
§10 变更记录
- 2026-05-30(草案):冻结 owner ↔ 主控对齐——内外主轴 / G0-G1-G2 / 数据消融 gate / 护城河集合 / A 子轴 / 两条线。待 owner 确认 §8 硬度后分步传导上位。
- 2026-05-30(传导):owner 拍定「三层都进」——已落 ① 战略不变量 I-14' CognitionDataIndependence(identity 级)② 产品定义 §1 定位要点 ③ 综合层规格 §9 判据 8 ④ 架构补充草稿(认知核/数据精修层分离 + 证据通道 + 优雅降级)。G2 护城河 = 战略路线图(后续);数据消融维度接入 eval = M1。