跳到主要内容

认知数据独立性 + 护城河 · 对齐冻结草案

本文是什么:2026-05-30 owner ↔ 主控就"FinBayes 认知与外部数据/模型的关系"做了一轮深度对齐,本文把已达成共识冻结为单一可审源,防 /compact 丢失。它本身不是上位文档——共识确认后按 §8 落地图分步传导到战略不变量 / 产品定义 / 架构 / 综合层规范,硬度待 owner 拍。

触发:M0 L8 not-confirm → R1a prompt 整改 → 与竞品 FinClaw 同条件(gpt-5.5 / 无外部数据 / 无记忆画像)两轮对照(标的交易类 + 纯认知类)→ 暴露"R1a 内容其实不弱、差在表达 + 无护城河"→ owner 系列澄清,逼出本框架。

§1 主轴:FinBayes 内部 vs 外部

从 FinBayes 自身视角划界(owner 2026-05-30 拍定):

内容代号
内部(自有认知)认知体系(推理方法/结构)+ 金融知识库 + 金融经验库 +(远期)自有金融专家模型C
外部全部数据/信息——不分来源/通道:用户本地上传(K 线图 / 内部研报 / 文本)与第三方 API / 搜索 / Data Horizon 一视同仁,对 FinBayes 都是外部A
借来的通用模型(在被 C 内化前都算外部/借来的)B

关键认知(owner 纠正):用户本地上传的数据/信息也是 FinBayes 的外部数据,与第三方源在原则上一视同仁;"用户上传 vs API" 只是 A 的工程子轴(§5),不是主轴。

§2 三个正交目标 G0 / G1 / G2

目标定义关于性质现状
G0 表达易读 / 活人感 / 干货无废话,符合综合层认知输出规格出口(与 A/B/C 无关)交付质量缺渲染层(R1c 未做)
G1 鲁棒认知不强依赖任何外部数据 A(任何来源/通道);A 一律是辅助证据(完善 / 矫正 / 佐证),永不是前提独立于 A设计不变量(可测、近二元)内容层 C5/C6 已达标
G2 护城河认知质量从借来的 B 逐步迁到自有 CB→C战略 / 竞争(渐进、长程)≈0% 下水

这取代了早先含糊的"T1/T2 两档独立性"——它们性质不同(鲁棒性 vs 护城河),不应并列成一根轴。

§3 G1 的工程化判据:数据消融 gate(避免停在抽象)

同一批 case,按证据通道分模式跑,G1 成立当且仅当:

  • 核断言(抽掉全部 A)
    1. 仍过规格 §9(高质量有条件认知 + 诚实标缺口);
    2. 数据精修层不伪造——posterior / s1 / mca_bucket / 具体数字 要么缺省、要么显式标"未拟合(无证据)",绝不假填
    3. 认知核预先枚举出"证据来了会改变什么"的槽位(成立 / 失效条件、缺口),使带证据时是对这些已声明槽位的 resolution,而非引入认知核从未预告的新主因。
  • 能力断言(按 A 子轴分项,不污染原则):A 经"用户上传"通道(图 / 文档 / 文本)提供时,能真正读进并用于判断,且离线时不偷连外部源

价值:可证伪、可建成评测维度("数据消融鲁棒性")。核断言第 2 条当场判了 M0 假填违规(见 §7)。

§4 G2 护城河 = 必要合取集(认知体系为脊柱)

非单一充分条件,是一组缺一不够的组件:

#组件方法 / 内容
1认知体系(MCA / S1 / 8 机制 / 贝叶斯更新 / 任务-字段组合)方法为主——怎么想
2金融知识库(事实 / 框架 / 关系,可下载升级迭代)内容——知道什么
3金融经验库(case 校准 / 判断记录 / 成败复盘)内容——学到什么
4认知表达规范(= G0)交付——怎么说
5评测 + 迭代体系(适应度函数驱动的自改进闭环)元能力——会变好
6(远期)自有金融专家模型把 1–3 内化进权重

认知体系是脊柱:它既作为方法运行,其被 codify 的部分(MCA 轴定义、8 机制、S1 规则)本身就是知识库的核心内容——方法与内容在脊柱处重叠,这是 FinBayes 的特征:推理方法本身是一种可沉淀的金融知识。

诚实基线:在同条件对照里 G2 集合 ≈0% 下水(MCA/S1/posterior 假填、无知识库注入、质量全来自 gpt-5.5),这正是 FinClaw 能打平的原因

§5 A 的工程子轴(预留接口、不污染原则)

子轴取值影响
通道 / 连通性用户上传(离线) / 第三方源(联网)安全 / 内网可用性
模态文本 / 图(K 线) / 文档(PDF) / 多模态需多模态摄入 + 多模态模型(B)
时序一次性 / 持续跟踪需会话 + 结构化记忆

两个必须支持的场景(owner 提)归位:① 仅接一个(可能本地部署)模型、上传 K 线图求分析;② 上传组织内部非公开研报 + 持续多模态跟踪/update。二者都是 "A 经用户上传通道进、外部源被切断":G1 统一处理(不要求、但提供则充分吃进);通道 / 模态 / 时序按子轴实现。

现在留接口、later 实现:多模态摄入 + 持续跟踪是 M1+;离线由 provider 抽象已支持。原则层只认 C / A / B,子轴是 A 的实现细节,绝不上提到原则。约束:场景①需多模态模型,组织本地部署模型未必多模态——场景前提要标明。

§6 两条线(防误判 M0 节奏)

  • M0 的 L8 门槛 = "像不像 FinBayes、有没有活人感" → R1a + R1c 在借来的 gpt-5.5 质量上即可达。
  • 赢 FinClaw / 有护城河 = 需 G2 集合下水 → M1+/M2

M0 不需要、也还不可能赢 FinClaw;M0 只需过 L8。 两条线分开,整改节奏才不乱。

§7 由本框架直接掉出的行动项

内容归属
R1b 相邻小修(已纳入 M0,owner 拍)无真实证据时 posterior / s1 / mca_bucket 诚实标"未拟合(无证据)",停止假常量填充(违 §3 核断言 2)M0 整改
R1c 渲染层(= G0)把认知核 + 结构化字段渲染成可扫读用户面(先最松放开、再最小化约束 —— owner 定的渲染哲学)M0 整改
评测加"数据消融鲁棒性"维度把 §3 gate 接入 eval harnessM1
认知体系真正下水(MCA/S1/posterior 真算) + 知识/经验库注入G2 起步M1+

§8 codify 落地图(硬度待 owner 拍)

内容候选上位落点硬度
G1 + 内外主轴 + 数据为辅助证据战略不变量 codify(I 系列) 或 产品定义定位段P0 / 中
认知核 vs 数据精修层分离 + 优雅降级 + 禁假填 + 证据通道接口预留架构补充 + 规格 §9工程 / Layer 0
"认知核数据独立"作为 §9 判据 + 数据消融 gate综合层认知输出规格 §9 + evalLayer 0
"离线 + 多模态 + 吃用户自带证据"= 机构 / 内网差异点产品定义定位段定位
G2 护城河集合(认知体系 / 知识库 / 经验库 / 评测迭代 / 自有模型)战略路线图 / 架构远期战略

注:本框架不属于 ADR-009(那是 prompt 版本化机制);它的家在战略 / 产品 / 架构 / Layer 0 规格。传导走 governance/change-protocol.md,P0 项需 owner 签字。

§9 实证依据(同条件对照,本地运行)

  • 方法:FinClaw 降级到与 M0 同条件(gpt-5.5 / 零工具 / 无记忆画像,零工具经运行时 monkeypatch,配置字节级无损恢复);FinBayes 用 R1a(gpt-5.5)。
  • 批一(标的 / 交易类 5 题):实质相近,FinBayes 输在排版 / 决断 / 钩子;FinClaw "更具体"部分来自替用户拍执行参数(越 §3 边界)。
  • 批二(纯认知 / 理论类 6 题,无需数据):FinBayes 认知不弱反深(C5 贝叶斯 / C6 反身性的多视角 + 反方达职业级),差距 100% 在呈现——最强内容困在 JSON 未渲染。
  • 共同结论:同条件下两边质量主要都来自 gpt-5.5 → 印证 §4"护城河 ≈0% 下水";prompt 触顶,下一杠杆是 G2。

§10 变更记录

  • 2026-05-30(草案):冻结 owner ↔ 主控对齐——内外主轴 / G0-G1-G2 / 数据消融 gate / 护城河集合 / A 子轴 / 两条线。待 owner 确认 §8 硬度后分步传导上位。
  • 2026-05-30(传导):owner 拍定「三层都进」——已落 ① 战略不变量 I-14' CognitionDataIndependence(identity 级)② 产品定义 §1 定位要点 ③ 综合层规格 §9 判据 8 ④ 架构补充草稿(认知核/数据精修层分离 + 证据通道 + 优雅降级)。G2 护城河 = 战略路线图(后续);数据消融维度接入 eval = M1。