FinBayes 术语整顿 — 审词裁决表（草稿）

本文件是 2026-06-04 owner 发起的术语整顿的工作底稿，不是事实源。逐词裁决与 owner 对齐后，结论才回写 ecosystem/glossary.md（含「弃用术语」表）、各文档与代码命名，走 governance/change-protocol.md。

§1 为什么做这件事

owner 指出：本仓的文档、工程包、代码与 CURRENT-MILESTONE 里充斥着只有"造词的那次会话"才看得懂的术语（自造黑话如「硬化铺面」、借比喻如「结算/账本」、框歪心智模型如「问责」、私有编号如带撇号的不变量 ID）。后果是：换一个人或一个没有同等上下文的 Agent 接手迭代、维护、修 bug，读不懂、对不齐、会理解漂移和执行偏差。一个只有原作者读得懂的 SSOT 不是事实源，是私人笔记。

mandate（owner 2026-06-04）：① 完整整顿，不是填洞了事；② 进了 glossary 不等于这个词就对——已收录的也全部重审，词本身可能在说谎或把设计带偏（先例：kelly_cap 判"误导"已删、行动判断 因"混淆认知材料与交易决策"已弃用）。

§2 三条原则（owner 定）

A · 语义准确：避免自创术语和黑话；避免人和 Agent 看不懂、语义模糊、理解和执行偏差漂移。
B · 易读可维护：别人和别的 Agent 接手的文档与代码都要读得懂、改得动。
C · 全球一致：FinBayes 面向全球，不同国家/区域/语种/文化语境的用户尽量理解一致。术语不能依赖单一语言的特有联想（如「问责」的中文官场色彩），要能干净翻译、且各语种意义一致。

§3 元规则（从逐词讨论里沉淀，作裁决判据）

精确 vs 易懂冲突时，朝易懂偏。（宁要不完全精确但人人秒懂的「跟进」，也不要精确但难懂的「结算」。）
默认普通日常词。 借来的比喻（结算、账本）和自造词（问责、硬化铺面）一律先当有罪，须证明"非它不可"才留。
状态词不许夹带时态或程度。 不许「还成立」「已不成立」（偷塞时态"还/已"）；一个词只装一个干净概念。
一旦想用"部分/partial"，那是"底层东西是复合的"信号——该把判断拆成一条一个可证伪 claim，或强制列明哪条对哪条错，不许用一个模糊的"部分"糊过去。
三类术语分层对待：
- 内部术语（glossary / 代码 / 编号）：让全球工程师和 Agent 维护得了即可。
- 产品面向用户术语：门槛最高，要全球用户看懂、要可本地化。
- 外部标准词（如 xfail、Brier）：保留不自造，但加一行"去哪查"的指引。

§4 审词方法（每个词跑这一套）

① 字面义与情感色彩 → ② 实际指的机制是什么 → ③ 错在哪（自造黑话 / 借比喻 / 框歪心智模型 / 混淆语义层 / 夸大保证 / 名不副实）→ ④ 会不会把设计或思考带偏（最重的一类）→ ⑤ 跨文化可译吗、是内部词还是产品面向词 → 裁决：保留 / 改措辞 / 改名 / 拆分 / 退役，要改就给候选词 + 理由，候选词再过一遍同一套。

§5 已敲定的核心成果（owner 已对齐）

5.1 「问责」族退役 → 「判断跟进 + 校准」，不要伞形词

「问责」把"agent 自省—对账—校准"框成了"追责法庭"，还把设计往 owner 想避开的"记分牌式表演"拽，且带中文官场色彩、跨文化失败。退役。拆成两件白话说清的事，不挂"可问责"这种标签：

判断跟进：agent 主动回到一条过去的判断，看现实后来怎么走，给它一个现在的状态与结论。
校准：跨很多条判断，看它报的把握（置信度）和实际应验比例一不一致。
差异化白话说：「FinBayes 会主动跟进自己说过的判断，并校准自己的把握」。

5.2 判断跟进的两层模型（锁定为契约；操作细节待真建时补）

把"在生命周期哪一步"和"结论是什么"彻底分开——上一版把时态和程度塞进一个维度造成的"还成立/部分成立"之糊，由此消除。英文 snake_case 即代码枚举值、中文即展示，同时服务原则 B 与 C。

verification_status   # 验证状态：生命周期，任意时刻只处一态
  pending_observation  待观察    预测窗口还没到，结果尚未发生
  pending_review       待核验    结果可能已出现，但还没完成核验
  verified             已验证    已经完成核验，有结论
  blocked              核验受阻  想核但证据不足/口径不清/数据冲突（可能暂时，补证后可解）
  unverifiable         不可验证  原判断本身不可操作/不可证伪/无明确标准（永久）

verdict               # 验证结论：仅当 verification_status = verified 才有值，否则为 null
  correct              正确
  wrong                错误
  partial              部分正确（须列明哪条对/错；或登记时即拆成原子 claim）
  inconclusive         无法判定  核验做了，但现实确实判不出对错（与上面 blocked/unverifiable 是三种不同的"判不了"）
  null                 暂无结论  尚未 verified——看 verification_status

三种"判不了"已彻底分开：unverifiable（判断没写成可证伪，永久）/ blocked（证据不足，可能暂时）/ inconclusive（核完了但现实两可）。 接线规则：verdict 只在 verification_status = verified 时才有值，否则为 null（owner："结论已核实才有值"）。

§6 裁决表（已审部分）

「原意」列是必填项：判一个词之前，先记下它当初在什么场景下、想表达什么——替换才不丢原意，读的人也懂它指什么。§7 grind 时每个词都照填此列。

词	类别	原意（在什么场景、想表达什么）	病	裁决 / 替换	状态
问责 / 可问责	FinBayes 内部，未进 glossary	组件 14 / 差异化卖点：agent 不说完就走，会对过去说过的判断负责到底——到期或被市场触及时回来对账、给结论、累积校准	框歪心智模型 + 带偏设计 + 官场色彩跨文化失败	退役 → 判断跟进 + 校准；差异化白话说	✅ 已定
三态结算	FinBayes 内部	判断跟进的输出：一条判断被核验后落到的最终结果（想用"结算"表达"给这条判断结个最终账"）	"结算"借金融比喻、不透明	改名 → §5.2 两层枚举	✅ 已定
校准账本	FinBayes 内部	组件 14 校准维度：一份按时间累积的记录，记每条判断的结算结果 + 当时置信度，用来看判断质量随时间是否可靠	"校准"准；"账本"借比喻	改措辞 → 校准记录	✅ 已定
硬化铺面	自造黑话（漏进 `architecture.md`）	建造顺序某阶段：把已能跑的 agent 加固到经得起真用（护栏/持久化抗损/隔离墙）并把功能面铺开（多渠道/规划子代理）	纯自造、无人能懂	退役 → 按上下文白话（"加固到能真用"+"扩展功能面"）	✅ 已定
不完整的绿	自造黑话	验证纪律：测试过了但只证明代码接线通，没证明真实 LLM 在真实场景会这么行为——"看着绿、实则没验到位"	纯自造	改名 → "接线级通过（尚未验证真实行为）"	✅ 已定
MCA / 横切维度 / 桶	glossary 已收录（85+ 文件）	认知体系 + 评测：7 个共享输入分轴（投资者结构/衍生品成熟度/…）决定 M1–M8 在不同市场结构下用什么参数运算；"桶"= 评测按这 7 轴把样本分组分层	"横切"软件借词、"桶"ML 黑话，金融用户难懂；概念实需	概念保留、标签重审 → 候选"市场结构分类/分组"；代码保留 `MCA` 但配可读全称	🔶 暂定
`xfail`	外部标准词（pytest）	用 pytest 的"预期失败"标记当"对应功能还没建"的活体提醒：现在该红，建好后意外变绿即报警	非 pytest 背景看不懂	保留 + 加一行查阅指引	✅ 已定
不变量编号 `I-NN'`（撇号）+ `JudgmentRecordIsLiveMemory` 式名	代码文件名 + docstring	给每条不变量一个稳定可引用的短编号；撇号 `'` 想区分"建造态契约型(I-NN')"与早期"禁令型(I-NN)"；CamelCase 英文名想给编号配个一眼记得住的语义别名	撇号极隐晦、编号指向散落私有索引	保留编号 + 建可读索引（编号→人话→源），重审撇号约定	🔶 暂定
Brier	外部标准词（统计）	校准维度度量：用 Brier 分数衡量 agent 报的置信度与事后应验频率是否一致；"最小 Brier"本想说"最小校准种子"、压缩误写	真术语但 KB 无查阅指引；"最小 Brier"是病句	保留 + 查阅指引；"最小 Brier"退役	✅ 已定

§6.A 治理 / 基础设施类（glossary，逐条已过）

合格的归并一行，contested 的单列。

词	原意	病	裁决	状态
ADR、Ecosystem、FinTec AI、事实源、Pagefind、治理协议、基线、派生物、派生脚本、自动派生、能力底座、Task Packet、topic、agent-pack、Handoff Anchor	各自见 glossary：治理/派生/对齐基础设施词	标准业界词或中文自解释、合规	保留	✅
CM（Commons 方法论资产）	可从单项目升格到 commons 的跨项目方法论/模板	缩写 `CM` 抽象、且 glossary 自注"与 L/D/S 不是一套缩写"——有撞名史	少用缩写、正文写"Commons 资产"	🔶 暂定
escalation / 升级	冲突/权限不足无法当前层解决时上移裁决	中文"升级"与"版本升级"撞义	改 → "上报裁决 / 上移"	🔶 暂定
L / D / S layers（对齐颗粒）	三层对齐颗粒：战略 / 设计 / 执行	单字母编码不自解释、"颗粒"怪词、有 M→D 改名撞名史	直接称"战略层/设计层/执行层"，编号仅作内部简写	🔶 暂定
Readiness-gated / 就绪门禁、就绪门禁 Readiness gate	未满足前置信号前只留边界、不展开细节	两条近重复词条；"门禁"比喻尚可	合并为一条	🔶 暂定
Controller、对齐 Alignment	管控角色 / 认知同步	各撞软件 MVC、AI Safety alignment，但 glossary 已加"不是…"澄清	保留 + 维持澄清	✅

§6.B FinBayes 认知 / 产品类（glossary，逐条已过）

词	原意	病	裁决	状态
金融执行凭证、成立条件 / 失效条件、Watchlist / Judgment Record / Dynamic Profile、本地优先单机、金融世界模型、前台系统 / 前台产品	安全边界 / 可证伪要素 / 三类长期资产 / 部署形态 / 模拟器 / 面向用户对象	准确、直白、可译；多为业界惯例或核心边界词	保留（"失效条件""判断记录"还正好接上 §5 判断跟进，一致）	✅
认知材料	FinBayes 输出的结构化金融认知内容统称（条件化/可复盘/带不确定性）	"材料"偏空泛，作面向用户词不够具体	重议是否更具体（如"判断内容/认知输出"）	🔶 暂定
交易行动前检查	用户接近交易动作时 FinBayes 输出的条件化判断材料	词性错位：指的是一份材料，却叫"检查"（像动作/流程）；但它是"行动判断"弃用后经 ADR 决议的替代词，动它须谨慎	重议（保概念、修词性），改动走原 ADR	🔶 暂定
金融认知体系五件套	"懂金融"差异化体系层 = 8 机制 + MCA + S1 + 评测 + 迭代治理 5 个互锁部分	"五件套"俏皮（像厨具），数字写死、构成一变即过期；跨文化译出怪	改 → "金融认知体系（5 个互锁部分）"等描述式	🔶 暂定
8 机制（M1–M8）、S1（叙事-数字一致性横切子流程）、MCA 桶	体系定义层 8 步 / 输出前一致性校验子流程 / 按市场结构分层	编号 `M1–M8`/`S1` 有定义但不自解释；"机制""横切"措辞；整套字母数字编码新人高门槛（与 §6 不变量编号同病）	编号保留 + 并入下方统一可读索引；"横切"等措辞重议	🔶 暂定
双峰后验 BimodalPosterior	M7.uq 输出形态：双峰重尾贝叶斯后验	真统计术语、内部/工程准；面向用户时难懂	内部保留；产品面向时通俗化展示	✅

§6.C 代码 / 工程内部术语（逐条已过）

词	原意	病	裁决	状态
`StructuredCognitionResult`、`posterior`、`slow_thinking` / 慢思考	认知核单次综合结果对象 / 贝叶斯后验 / 系统二式深思路径（借 Kahneman）	英文自解释代码标识，或借自公认概念，直白	保留	✅
`s1`、组件 N（1–14）、阶段 N（0–4）	S1 子流程代码名 / 蓝图骨架 14 组件编号 / 建造顺序阶段编号	编号指向散落私有索引（要读蓝图才知"组件 9=主动性""组件 14=问责"）；"阶段 3"定义本身还在漂（SSOT 待你定）	编号保留 + 引用处带名 + 并入统一可读索引；"阶段 3"待你拍	🔶 暂定
`kelly` / `kelly_cap`	已退役的凯利上限硬约束（ADR-021）	残留三种：① eval-harness D6/D11 公式仍带活 `C_kelly` 项（§4.8 故意留账，权重归一属评测契约，待 FinTecEval/owner）；② m1_5/m1_6 链到已退役 MP-3 未标注；③ 其余退役记录/边界声明	①留 FinTecEval/owner；②术语回写时补"已退役"标注；③保留作 audit trail	✅ 已退役、传播待尽

§6.D grind 的头号系统性发现：编号体系缺一份可读索引

跑完全量，最大的系统性病不是某个词，而是一整套字母/数字编号散落各处、各指一份私有索引：I-NN'（不变量，还带撇号）、组件 N、阶段 N、M1–M8、S1、MCA、L/D/S、CM。每一个单看都有定义，但新人或新 Agent 撞上 test_i16_*.py、docstring 里的"组件 9""M7.uq""按 MCA 桶分层"时，得满仓找定义。单条最高价值的修法 = 建一份「编号 → 人话 → 事实源」总索引（一处可查所有编码体系），各编号本身不必改、但引用处尽量带名。这条覆盖了上面多个 🔶。

§7 定稿：全部已与 owner 对齐（2026-06-05）

§6 的 🔶 全部拍定，最终口径如下：

FinBayes 核心词

问责 / 可问责 → 退役，拆「判断跟进 + 校准」，差异化白话说，不挂伞形标签。
三态结算 / 校准账本 → 「判断跟进」两层验证枚举（§5.2）+「校准记录」。
交易行动前检查 → 交易决策参考材料（修「检查」词性错位、且不让 FinBayes 站进「决策者」位——「交易决策」是用户的、材料是 FinBayes 的；经原 ADR 决议，须走 ADR 改）。
认知材料 → 保留（"材料" 是刻意的"我供料、你决策"框架）。
金融认知体系五件套 → 金融认知体系，构成开放描述（体系本就动态演进，不写死数字）。

治理四词

CM → 退缩写，正文写 Commons 资产。
escalation / 升级 → 中文改 上报裁决（英文 escalation 保留）。
L / D / S layers → 「颗粒」改「层级」，字母保留作简写、首次带词（战略层 L / 设计层 D / 执行层 S）；⚠ 待查 L 与文档层级 L0–L4 的 L 是否撞名。
Readiness 两条 → 合并一条。

MCA / 机制措辞

MCA「横切维度 / 桶」→ 市场结构分轴（7 分轴）/「按市场结构分组」；代码留 MCA + 索引带全称。
「横切」→ 跨机制（S1 = 跨机制一致性校验）。

统一编号命名规范

去隐晦标点（撇号 ' 首当其冲）；类型不进 ID、进索引列。
形如 可读前缀-编号；引用处首次必带展开名。
真改 ID 的只有不变量 I-NN' → INV-NN（碰代码，交工程会话）；M1–M8/S1/D1–D11/组件/阶段 不改 ID，靠「首次带名 + 索引」达到看得懂。
建《代号与编号索引》（§6.D），收全 INV / 组件 / 阶段 / M / S / D / MCA / L·D·S / CM / MP / ADR：代号 → 人话 → 事实源。

阶段 3

术语：阶段带描述名。实质：阶段 3 = 加固与可用化；判断跟进 + 校准（原「问责」）移出编号阶段、作单独课题待"真实手感"后设计。

§8 落地步骤（写回）

✅ SSOT 阶段 3 漂移 + 阶段描述名已改（2026-06-05 本轮，CURRENT-MILESTONE §1/§4/§3quater）。
✅ 本草稿定稿（本轮）。
⏳ 下一步：起 ADR 正式记录本次术语整顿（含上面全部裁定、命名规范、对 ADR-020「可问责」重新摆位、对「行动判断」弃用补「交易决策参考材料」）——ecosystem/glossary 改动须由此 ADR 经 governance/change-protocol.md 授权。
⏳ ADR 落后：写 glossary（改名 + 弃用表 + 新建《代号与编号索引》，索引需从源头抓全 16 条不变量 / 14 组件 / M1–M8 名）+ 文档措辞。
⏳ 碰代码的（I-NN'→INV-NN、s1 等）排最后、交工程会话（先定词、再改代码）。

§1 为什么做这件事​

§2 三条原则（owner 定）​

§3 元规则（从逐词讨论里沉淀，作裁决判据）​

§4 审词方法（每个词跑这一套）​

§5 已敲定的核心成果（owner 已对齐）​

5.1 「问责」族退役 → 「判断跟进 + 校准」，不要伞形词​

5.2 判断跟进的两层模型（锁定为契约；操作细节待真建时补）​

§6 裁决表（已审部分）​

§6.A 治理 / 基础设施类（glossary，逐条已过）​

§6.B FinBayes 认知 / 产品类（glossary，逐条已过）​

§6.C 代码 / 工程内部术语（逐条已过）​

§6.D grind 的头号系统性发现：编号体系缺一份可读索引​

§7 定稿：全部已与 owner 对齐（2026-06-05）​

§8 落地步骤（写回）​