跳到主要内容

FinBayes 术语整顿 — 审词裁决表(草稿)

本文件是 2026-06-04 owner 发起的术语整顿的工作底稿,不是事实源。逐词裁决与 owner 对齐后,结论才回写 ecosystem/glossary.md(含「弃用术语」表)、各文档与代码命名,走 governance/change-protocol.md

§1 为什么做这件事

owner 指出:本仓的文档、工程包、代码与 CURRENT-MILESTONE 里充斥着只有"造词的那次会话"才看得懂的术语(自造黑话如「硬化铺面」、借比喻如「结算/账本」、框歪心智模型如「问责」、私有编号如带撇号的不变量 ID)。后果是:换一个人或一个没有同等上下文的 Agent 接手迭代、维护、修 bug,读不懂、对不齐、会理解漂移和执行偏差。一个只有原作者读得懂的 SSOT 不是事实源,是私人笔记。

mandate(owner 2026-06-04):① 完整整顿,不是填洞了事;② 进了 glossary 不等于这个词就对——已收录的也全部重审,词本身可能在说谎或把设计带偏(先例:kelly_cap 判"误导"已删、行动判断 因"混淆认知材料与交易决策"已弃用)。

§2 三条原则(owner 定)

  • A · 语义准确:避免自创术语和黑话;避免人和 Agent 看不懂、语义模糊、理解和执行偏差漂移。
  • B · 易读可维护:别人和别的 Agent 接手的文档与代码都要读得懂、改得动。
  • C · 全球一致:FinBayes 面向全球,不同国家/区域/语种/文化语境的用户尽量理解一致。术语不能依赖单一语言的特有联想(如「问责」的中文官场色彩),要能干净翻译、且各语种意义一致。

§3 元规则(从逐词讨论里沉淀,作裁决判据)

  1. 精确 vs 易懂冲突时,朝易懂偏。(宁要不完全精确但人人秒懂的「跟进」,也不要精确但难懂的「结算」。)
  2. 默认普通日常词。 借来的比喻(结算、账本)和自造词(问责、硬化铺面)一律先当有罪,须证明"非它不可"才留。
  3. 状态词不许夹带时态或程度。 不许「还成立」「已不成立」(偷塞时态"还/已");一个词只装一个干净概念。
  4. 一旦想用"部分/partial",那是"底层东西是复合的"信号——该把判断拆成一条一个可证伪 claim,或强制列明哪条对哪条错,不许用一个模糊的"部分"糊过去。
  5. 三类术语分层对待
    • 内部术语(glossary / 代码 / 编号):让全球工程师和 Agent 维护得了即可。
    • 产品面向用户术语:门槛最高,要全球用户看懂、要可本地化。
    • 外部标准词(如 xfailBrier):保留不自造,但加一行"去哪查"的指引。

§4 审词方法(每个词跑这一套)

① 字面义与情感色彩 → ② 实际指的机制是什么 → ③ 错在哪(自造黑话 / 借比喻 / 框歪心智模型 / 混淆语义层 / 夸大保证 / 名不副实)→ ④ 会不会把设计或思考带偏(最重的一类)→ ⑤ 跨文化可译吗、是内部词还是产品面向词 → 裁决:保留 / 改措辞 / 改名 / 拆分 / 退役,要改就给候选词 + 理由,候选词再过一遍同一套

§5 已敲定的核心成果(owner 已对齐)

5.1 「问责」族退役 → 「判断跟进 + 校准」,不要伞形词

「问责」把"agent 自省—对账—校准"框成了"追责法庭",还把设计往 owner 想避开的"记分牌式表演"拽,且带中文官场色彩、跨文化失败。退役。拆成两件白话说清的事,不挂"可问责"这种标签

  • 判断跟进:agent 主动回到一条过去的判断,看现实后来怎么走,给它一个现在的状态与结论。
  • 校准:跨很多条判断,看它报的把握(置信度)和实际应验比例一不一致。
  • 差异化白话说:「FinBayes 会主动跟进自己说过的判断,并校准自己的把握」。

5.2 判断跟进的两层模型(锁定为契约;操作细节待真建时补)

把"在生命周期哪一步"和"结论是什么"彻底分开——上一版把时态和程度塞进一个维度造成的"还成立/部分成立"之糊,由此消除。英文 snake_case 即代码枚举值、中文即展示,同时服务原则 B 与 C。

verification_status # 验证状态:生命周期,任意时刻只处一态
pending_observation 待观察 预测窗口还没到,结果尚未发生
pending_review 待核验 结果可能已出现,但还没完成核验
verified 已验证 已经完成核验,有结论
blocked 核验受阻 想核但证据不足/口径不清/数据冲突(可能暂时,补证后可解)
unverifiable 不可验证 原判断本身不可操作/不可证伪/无明确标准(永久)

verdict # 验证结论:仅当 verification_status = verified 才有值,否则为 null
correct 正确
wrong 错误
partial 部分正确(须列明哪条对/错;或登记时即拆成原子 claim)
inconclusive 无法判定 核验做了,但现实确实判不出对错(与上面 blocked/unverifiable 是三种不同的"判不了")
null 暂无结论 尚未 verified——看 verification_status

三种"判不了"已彻底分开unverifiable(判断没写成可证伪,永久)/ blocked(证据不足,可能暂时)/ inconclusive(核完了但现实两可)。 接线规则verdict 只在 verification_status = verified 时才有值,否则为 null(owner:"结论已核实才有值")。

§6 裁决表(已审部分)

「原意」列是必填项:判一个词之前,先记下它当初在什么场景下、想表达什么——替换才不丢原意,读的人也懂它指什么。§7 grind 时每个词都照填此列。

类别原意(在什么场景、想表达什么)裁决 / 替换状态
问责 / 可问责FinBayes 内部,未进 glossary组件 14 / 差异化卖点:agent 不说完就走,会对过去说过的判断负责到底——到期或被市场触及时回来对账、给结论、累积校准框歪心智模型 + 带偏设计 + 官场色彩跨文化失败退役 → 判断跟进 + 校准;差异化白话说✅ 已定
三态结算FinBayes 内部判断跟进的输出:一条判断被核验后落到的最终结果(想用"结算"表达"给这条判断结个最终账")"结算"借金融比喻、不透明改名 → §5.2 两层枚举✅ 已定
校准账本FinBayes 内部组件 14 校准维度:一份按时间累积的记录,记每条判断的结算结果 + 当时置信度,用来看判断质量随时间是否可靠"校准"准;"账本"借比喻改措辞 → 校准记录✅ 已定
硬化铺面自造黑话(漏进 architecture.md建造顺序某阶段:把已能跑的 agent 加固到经得起真用(护栏/持久化抗损/隔离墙)并把功能面铺开(多渠道/规划子代理)纯自造、无人能懂退役 → 按上下文白话("加固到能真用"+"扩展功能面")✅ 已定
不完整的绿自造黑话验证纪律:测试过了但只证明代码接线通,没证明真实 LLM 在真实场景会这么行为——"看着绿、实则没验到位"纯自造改名 → "接线级通过(尚未验证真实行为)"✅ 已定
MCA / 横切维度 / 桶glossary 已收录(85+ 文件)认知体系 + 评测:7 个共享输入分轴(投资者结构/衍生品成熟度/…)决定 M1–M8 在不同市场结构下用什么参数运算;"桶"= 评测按这 7 轴把样本分组分层"横切"软件借词、"桶"ML 黑话,金融用户难懂;概念实需概念保留、标签重审 → 候选"市场结构分类/分组";代码保留 MCA 但配可读全称🔶 暂定
xfail外部标准词(pytest)用 pytest 的"预期失败"标记当"对应功能还没建"的活体提醒:现在该红,建好后意外变绿即报警非 pytest 背景看不懂保留 + 加一行查阅指引✅ 已定
不变量编号 I-NN'(撇号)+ JudgmentRecordIsLiveMemory 式名代码文件名 + docstring给每条不变量一个稳定可引用的短编号;撇号 ' 想区分"建造态契约型(I-NN')"与早期"禁令型(I-NN)";CamelCase 英文名想给编号配个一眼记得住的语义别名撇号极隐晦、编号指向散落私有索引保留编号 + 建可读索引(编号→人话→源),重审撇号约定🔶 暂定
Brier外部标准词(统计)校准维度度量:用 Brier 分数衡量 agent 报的置信度与事后应验频率是否一致;"最小 Brier"本想说"最小校准种子"、压缩误写真术语但 KB 无查阅指引;"最小 Brier"是病句保留 + 查阅指引;"最小 Brier"退役✅ 已定

§6.A 治理 / 基础设施类(glossary,逐条已过)

合格的归并一行,contested 的单列。

原意裁决状态
ADR、Ecosystem、FinTec AI、事实源、Pagefind、治理协议、基线、派生物、派生脚本、自动派生、能力底座、Task Packet、topic、agent-pack、Handoff Anchor各自见 glossary:治理/派生/对齐基础设施词标准业界词或中文自解释、合规保留
CM(Commons 方法论资产)可从单项目升格到 commons 的跨项目方法论/模板缩写 CM 抽象、且 glossary 自注"与 L/D/S 不是一套缩写"——有撞名史少用缩写、正文写"Commons 资产"🔶 暂定
escalation / 升级冲突/权限不足无法当前层解决时上移裁决中文"升级"与"版本升级"撞义改 → "上报裁决 / 上移"🔶 暂定
L / D / S layers(对齐颗粒)三层对齐颗粒:战略 / 设计 / 执行单字母编码不自解释、"颗粒"怪词、有 M→D 改名撞名史直接称"战略层/设计层/执行层",编号仅作内部简写🔶 暂定
Readiness-gated / 就绪门禁、就绪门禁 Readiness gate未满足前置信号前只留边界、不展开细节两条近重复词条;"门禁"比喻尚可合并为一条🔶 暂定
Controller、对齐 Alignment管控角色 / 认知同步各撞软件 MVC、AI Safety alignment,但 glossary 已加"不是…"澄清保留 + 维持澄清

§6.B FinBayes 认知 / 产品类(glossary,逐条已过)

原意裁决状态
金融执行凭证、成立条件 / 失效条件、Watchlist / Judgment Record / Dynamic Profile、本地优先单机、金融世界模型、前台系统 / 前台产品安全边界 / 可证伪要素 / 三类长期资产 / 部署形态 / 模拟器 / 面向用户对象准确、直白、可译;多为业界惯例或核心边界词保留("失效条件""判断记录"还正好接上 §5 判断跟进,一致)
认知材料FinBayes 输出的结构化金融认知内容统称(条件化/可复盘/带不确定性)"材料"偏空泛,作面向用户词不够具体重议是否更具体(如"判断内容/认知输出")🔶 暂定
交易行动前检查用户接近交易动作时 FinBayes 输出的条件化判断材料词性错位:指的是一份材料,却叫"检查"(像动作/流程);但它是"行动判断"弃用后经 ADR 决议的替代词,动它须谨慎重议(保概念、修词性),改动走原 ADR🔶 暂定
金融认知体系五件套"懂金融"差异化体系层 = 8 机制 + MCA + S1 + 评测 + 迭代治理 5 个互锁部分"五件套"俏皮(像厨具),数字写死、构成一变即过期;跨文化译出怪改 → "金融认知体系(5 个互锁部分)"等描述式🔶 暂定
8 机制(M1–M8)、S1(叙事-数字一致性横切子流程)、MCA 桶体系定义层 8 步 / 输出前一致性校验子流程 / 按市场结构分层编号 M1–M8/S1 有定义但不自解释;"机制""横切"措辞;整套字母数字编码新人高门槛(与 §6 不变量编号同病)编号保留 + 并入下方统一可读索引;"横切"等措辞重议🔶 暂定
双峰后验 BimodalPosteriorM7.uq 输出形态:双峰重尾贝叶斯后验真统计术语、内部/工程准;面向用户时难懂内部保留;产品面向时通俗化展示

§6.C 代码 / 工程内部术语(逐条已过)

原意裁决状态
StructuredCognitionResultposteriorslow_thinking / 慢思考认知核单次综合结果对象 / 贝叶斯后验 / 系统二式深思路径(借 Kahneman)英文自解释代码标识,或借自公认概念,直白保留
s1、组件 N(1–14)、阶段 N(0–4)S1 子流程代码名 / 蓝图骨架 14 组件编号 / 建造顺序阶段编号编号指向散落私有索引(要读蓝图才知"组件 9=主动性""组件 14=问责");"阶段 3"定义本身还在漂(SSOT 待你定)编号保留 + 引用处带名 + 并入统一可读索引;"阶段 3"待你拍🔶 暂定
kelly / kelly_cap已退役的凯利上限硬约束(ADR-021)残留三种:① eval-harness D6/D11 公式仍带活 C_kelly 项(§4.8 故意留账,权重归一属评测契约,待 FinTecEval/owner);② m1_5/m1_6 链到已退役 MP-3 未标注;③ 其余退役记录/边界声明①留 FinTecEval/owner;②术语回写时补"已退役"标注;③保留作 audit trail✅ 已退役、传播待尽

§6.D grind 的头号系统性发现:编号体系缺一份可读索引

跑完全量,最大的系统性病不是某个词,而是一整套字母/数字编号散落各处、各指一份私有索引:I-NN'(不变量,还带撇号)、组件 N、阶段 N、M1–M8S1MCAL/D/SCM。每一个单看都有定义,但新人或新 Agent 撞上 test_i16_*.py、docstring 里的"组件 9""M7.uq""按 MCA 桶分层"时,得满仓找定义。单条最高价值的修法 = 建一份「编号 → 人话 → 事实源」总索引(一处可查所有编码体系),各编号本身不必改、但引用处尽量带名。这条覆盖了上面多个 🔶。

§7 定稿:全部已与 owner 对齐(2026-06-05)

§6 的 🔶 全部拍定,最终口径如下:

FinBayes 核心词

  • 问责 / 可问责 → 退役,拆「判断跟进 + 校准」,差异化白话说,不挂伞形标签。
  • 三态结算 / 校准账本 → 「判断跟进」两层验证枚举(§5.2)+「校准记录」。
  • 交易行动前检查 → 交易决策参考材料(修「检查」词性错位、且不让 FinBayes 站进「决策者」位——「交易决策」是用户的、材料是 FinBayes 的;经原 ADR 决议,须走 ADR 改)。
  • 认知材料 → 保留("材料" 是刻意的"我供料、你决策"框架)。
  • 金融认知体系五件套 → 金融认知体系,构成开放描述(体系本就动态演进,不写死数字)。

治理四词

  • CM → 退缩写,正文写 Commons 资产
  • escalation / 升级 → 中文改 上报裁决(英文 escalation 保留)。
  • L / D / S layers → 「颗粒」改「层级」,字母保留作简写、首次带词(战略层 L / 设计层 D / 执行层 S);⚠ 待查 L 与文档层级 L0–L4L 是否撞名。
  • Readiness 两条 → 合并一条

MCA / 机制措辞

  • MCA「横切维度 / 桶」→ 市场结构分轴(7 分轴)/「按市场结构分组」;代码留 MCA + 索引带全称。
  • 「横切」→ 跨机制(S1 = 跨机制一致性校验)。

统一编号命名规范

  • 去隐晦标点(撇号 ' 首当其冲);类型不进 ID、进索引列。
  • 形如 可读前缀-编号;引用处首次必带展开名。
  • 真改 ID 的只有不变量 I-NN'INV-NN(碰代码,交工程会话);M1–M8/S1/D1–D11/组件/阶段 不改 ID,靠「首次带名 + 索引」达到看得懂。
  • 建《代号与编号索引》(§6.D),收全 INV / 组件 / 阶段 / M / S / D / MCA / L·D·S / CM / MP / ADR:代号 → 人话 → 事实源。

阶段 3

  • 术语:阶段带描述名。实质:阶段 3 = 加固与可用化;判断跟进 + 校准(原「问责」)移出编号阶段、作单独课题待"真实手感"后设计。

§8 落地步骤(写回)

  1. SSOT 阶段 3 漂移 + 阶段描述名已改(2026-06-05 本轮,CURRENT-MILESTONE §1/§4/§3quater)。
  2. 本草稿定稿(本轮)。
  3. 下一步:起 ADR 正式记录本次术语整顿(含上面全部裁定、命名规范、对 ADR-020「可问责」重新摆位、对「行动判断」弃用补「交易决策参考材料」)——ecosystem/glossary 改动须由此 ADR 经 governance/change-protocol.md 授权。
  4. ⏳ ADR 落后:写 glossary(改名 + 弃用表 + 新建《代号与编号索引》,索引需从源头抓全 16 条不变量 / 14 组件 / M1–M8 名)+ 文档措辞。
  5. ⏳ 碰代码的(I-NN'INV-NNs1 等)排最后、交工程会话(先定词、再改代码)。