FinBayes 术语整顿 — 审词裁决表(草稿)
本文件是 2026-06-04 owner 发起的术语整顿的工作底稿,不是事实源。逐词裁决与 owner 对齐后,结论才回写
ecosystem/glossary.md(含「弃用术语」表)、各文档与代码命名,走governance/change-protocol.md。
§1 为什么做这件事
owner 指出:本仓的文档、工程包、代码与 CURRENT-MILESTONE 里充斥着只有"造词的那次会话"才看得懂的术语(自造黑话如「硬化铺面」、借比喻如「结算/账本」、框歪心智模型如「问责」、私有编号如带撇号的不变量 ID)。后果是:换一个人或一个没有同等上下文的 Agent 接手迭代、维护、修 bug,读不懂、对不齐、会理解漂移和执行偏差。一个只有原作者读得懂的 SSOT 不是事实源,是私人笔记。
mandate(owner 2026-06-04):① 完整整顿,不是填洞了事;② 进了 glossary 不等于这个词就对——已收录的也全部重审,词本身可能在说谎或把设计带偏(先例:kelly_cap 判"误导"已删、行动判断 因"混淆认知材料与交易决策"已弃用)。
§2 三条原则(owner 定)
- A · 语义准确:避免自创术语和黑话;避免人和 Agent 看不懂、语义模糊、理解和执行偏差漂移。
- B · 易读可维护:别人和别的 Agent 接手的文档与代码都要读得懂、改得动。
- C · 全球一致:FinBayes 面向全球,不同国家/区域/语种/文化语境的用户尽量理解一致。术语不能依赖单一语言的特有联想(如「问责」的中文官场色彩),要能干净翻译、且各语种意义一致。
§3 元规则(从逐词讨论里沉淀,作裁决判据)
- 精确 vs 易懂冲突时,朝易懂偏。(宁要不完全精确但人人秒懂的「跟进」,也不要精确但难懂的「结算」。)
- 默认普通日常词。 借来的比喻(结算、账本)和自造词(问责、硬化铺面)一律先当有罪,须证明"非它不可"才留。
- 状态词不许夹带时态或程度。 不许「还成立」「已不成立」(偷塞时态"还/已");一个词只装一个干净概念。
- 一旦想用"部分/partial",那是"底层东西是复合的"信号——该把判断拆成一条一个可证伪 claim,或强制列明哪条对哪条错,不许用一个模糊的"部分"糊过去。
- 三类术语分层对待:
- 内部术语(glossary / 代码 / 编号):让全球工程师和 Agent 维护得了即可。
- 产品面向用户术语:门槛最高,要全球用户看懂、要可本地化。
- 外部标准词(如
xfail、Brier):保留不自造,但加一行"去哪查"的指引。
§4 审词方法(每个词跑这一套)
① 字面义与情感色彩 → ② 实际指的机制是什么 → ③ 错在哪(自造黑话 / 借比喻 / 框歪心智模型 / 混淆语义层 / 夸大保证 / 名不副实)→ ④ 会不会把设计或思考带偏(最重的一类)→ ⑤ 跨文化可译吗、是内部词还是产品面向词 → 裁决:保留 / 改措辞 / 改名 / 拆分 / 退役,要改就给候选词 + 理由,候选词再过一遍同一套。
§5 已敲定的核心成果(owner 已对齐)
5.1 「问责」族退役 → 「判断跟进 + 校准」,不要伞形词
「问责」把"agent 自省—对账—校准"框成了"追责法庭",还把设计往 owner 想避开的"记分牌式表演"拽,且带中文官场色彩、跨文化失败。退役。拆成两件白话说清的事,不挂"可问责"这种标签:
- 判断跟进:agent 主动回到一条过去的判断,看现实后来怎么走,给它一个现在的状态与结论。
- 校准:跨很多条判断,看它报的把握(置信度)和实际应验比例一不一致。
- 差异化白话说:「FinBayes 会主动跟进自己说过的判断,并校准自己的把握」。
5.2 判断跟进的两层模型(锁定为契约;操作细节待真建时补)
把"在生命周期哪一步"和"结论是什么"彻底分开——上一版把时态和程度塞进一个维度造成的"还成立/部分成立"之糊,由此消除。英文 snake_case 即代码枚举值、中文即展示,同时服务原则 B 与 C。
verification_status # 验证状态:生命周期,任意时刻只处一态
pending_observation 待观察 预测窗口还没到,结果尚未发生
pending_review 待核验 结果可能已出现,但还没完成核验
verified 已验证 已经完成核验,有结论
blocked 核验受阻 想核但证据不足/口径不清/数据冲突(可能暂时,补证后可解)
unverifiable 不可验证 原判断本身不可操作/不可证伪/无明确标准(永久)
verdict # 验证结论:仅当 verification_status = verified 才有值,否则为 null
correct 正确
wrong 错误
partial 部分正确(须列明哪条对/错;或登记时即拆成原子 claim)
inconclusive 无法判定 核验做了,但现实确实判不出对错(与上面 blocked/unverifiable 是三种不同的"判不了")
null 暂无结论 尚未 verified——看 verification_status
三种"判不了"已彻底分开:unverifiable(判断没写成可证伪,永久)/ blocked(证据不足,可能暂时)/ inconclusive(核完了但现实两可)。
接线规则:verdict 只在 verification_status = verified 时才有值,否则为 null(owner:"结论已核实才有值")。
§6 裁决表(已审部分)
「原意」列是必填项:判一个词之前,先记下它当初在什么场景下、想表达什么——替换才不丢原意,读的人也懂它指什么。§7 grind 时每个词都照填此列。
| 词 | 类别 | 原意(在什么场景、想表达什么) | 病 | 裁决 / 替换 | 状态 |
|---|---|---|---|---|---|
| 问责 / 可问责 | FinBayes 内部,未进 glossary | 组件 14 / 差异化卖点:agent 不说完就走,会对过去说过的判断负责到底——到期或被市场触及时回来对账、给结论、累积校准 | 框歪心智模型 + 带偏设计 + 官场色彩跨文化失败 | 退役 → 判断跟进 + 校准;差异化白话说 | ✅ 已定 |
| 三态结算 | FinBayes 内部 | 判断跟进的输出:一条判断被核验后落到的最终结果(想用"结算"表达"给这条判断结个最终账") | "结算"借金融比喻、不透明 | 改名 → §5.2 两层枚举 | ✅ 已定 |
| 校准账本 | FinBayes 内部 | 组件 14 校准维度:一份按时间累积的记录,记每条判断的结算结果 + 当时置信度,用来看判断质量随时间是否可靠 | "校准"准;"账本"借比喻 | 改措辞 → 校准记录 | ✅ 已定 |
| 硬化铺面 | 自造黑话(漏进 architecture.md) | 建造顺序某阶段:把已能跑的 agent 加固到经得起真用(护栏/持久化抗损/隔离墙)并把功能面铺开(多渠道/规划子代理) | 纯自造、无人能懂 | 退役 → 按上下文白话("加固到能真用"+"扩展功能面") | ✅ 已定 |
| 不完整的绿 | 自造黑话 | 验证纪律:测试过了但只证明代码接线通,没证明真实 LLM 在真实场景会这么行为——"看着绿、实则没验到位" | 纯自造 | 改名 → "接线级通过(尚未验证真实行为)" | ✅ 已定 |
| MCA / 横切维度 / 桶 | glossary 已收录(85+ 文件) | 认知体系 + 评测:7 个共享输入分轴(投资者结构/衍生品成熟度/…)决定 M1–M8 在不同市场结构下用什么参数运算;"桶"= 评测按这 7 轴把样本分组分层 | "横切"软件借词、"桶"ML 黑话,金融用户难懂;概念实需 | 概念保留、标签重审 → 候选"市场结构分类/分组";代码保留 MCA 但配可读全称 | 🔶 暂定 |
xfail | 外部标准词(pytest) | 用 pytest 的"预期失败"标记当"对应功能还没建"的活体提醒:现在该红,建好后意外变绿即报警 | 非 pytest 背景看不懂 | 保留 + 加一行查阅指引 | ✅ 已定 |
不变量编号 I-NN'(撇号)+ JudgmentRecordIsLiveMemory 式名 | 代码文件名 + docstring | 给每条不变量一个稳定可引用的短编号;撇号 ' 想区分"建造态契约型(I-NN')"与早期"禁令型(I-NN)";CamelCase 英文名想给编号配个一眼记得住的语义别名 | 撇号极隐晦、编号指向散落私有索引 | 保留编号 + 建可读索引(编号→人话→源),重审撇号约定 | 🔶 暂定 |
| Brier | 外部标准词(统计) | 校准维度度量:用 Brier 分数衡量 agent 报的置信度与事后应验频率是否一致;"最小 Brier"本想说"最小校准种子"、压缩误写 | 真术语但 KB 无查阅指引;"最小 Brier"是病句 | 保留 + 查阅指引;"最小 Brier"退役 | ✅ 已定 |
§6.A 治理 / 基础设施类(glossary,逐条已过)
合格的归并一行,contested 的单列。
| 词 | 原意 | 病 | 裁决 | 状态 |
|---|---|---|---|---|
| ADR、Ecosystem、FinTec AI、事实源、Pagefind、治理协议、基线、派生物、派生脚本、自动派生、能力底座、Task Packet、topic、agent-pack、Handoff Anchor | 各自见 glossary:治理/派生/对齐基础设施词 | 标准业界词或中文自解释、合规 | 保留 | ✅ |
| CM(Commons 方法论资产) | 可从单项目升格到 commons 的跨项目方法论/模板 | 缩写 CM 抽象、且 glossary 自注"与 L/D/S 不是一套缩写"——有撞名史 | 少用缩写、正文写"Commons 资产" | 🔶 暂定 |
| escalation / 升级 | 冲突/权限不足无法当前层解决时上移裁决 | 中文"升级"与"版本升级"撞义 | 改 → "上报裁决 / 上移" | 🔶 暂定 |
| L / D / S layers(对齐颗粒) | 三层对齐颗粒:战略 / 设计 / 执行 | 单字母编码不自解释、"颗粒"怪词、有 M→D 改名撞名史 | 直接称"战略层/设计层/执行层",编号仅作内部简写 | 🔶 暂定 |
| Readiness-gated / 就绪门禁、就绪门禁 Readiness gate | 未满足前置信号前只留边界、不展开细节 | 两条近重复词条;"门禁"比喻尚可 | 合并为一条 | 🔶 暂定 |
| Controller、对齐 Alignment | 管控角色 / 认知同步 | 各撞软件 MVC、AI Safety alignment,但 glossary 已加"不是…"澄清 | 保留 + 维持澄清 | ✅ |
§6.B FinBayes 认知 / 产品类(glossary,逐条已过)
| 词 | 原意 | 病 | 裁决 | 状态 |
|---|---|---|---|---|
| 金融执行凭证、成立条件 / 失效条件、Watchlist / Judgment Record / Dynamic Profile、本地优先单机、金融世界模型、前台系统 / 前台产品 | 安全边界 / 可证伪要素 / 三类长期资产 / 部署形态 / 模拟器 / 面向用户对象 | 准确、直白、可译;多为业界惯例或核心边界词 | 保留("失效条件""判断记录"还正好接上 §5 判断跟进,一致) | ✅ |
| 认知材料 | FinBayes 输出的结构化金融认知内容统称(条件化/可复盘/带不确定性) | "材料"偏空泛,作面向用户词不够具体 | 重议是否更具体(如"判断内容/认知输出") | 🔶 暂定 |
| 交易行动前检查 | 用户接近交易动作时 FinBayes 输出的条件化判断材料 | 词性错位:指的是一份材料,却叫"检查"(像动作/流程);但它是"行动判断"弃用后经 ADR 决议的替代词,动它须谨慎 | 重议(保概念、修词性),改动走原 ADR | 🔶 暂定 |
| 金融认知体系五件套 | "懂金融"差异化体系层 = 8 机制 + MCA + S1 + 评测 + 迭代治理 5 个互锁部分 | "五件套"俏皮(像厨具),数字写死、构成一变即过期;跨文化译出怪 | 改 → "金融认知体系(5 个互锁部分)"等描述式 | 🔶 暂定 |
| 8 机制(M1–M8)、S1(叙事-数字一致性横切子流程)、MCA 桶 | 体系定义层 8 步 / 输出前一致性校验子流程 / 按市场结构分层 | 编号 M1–M8/S1 有定义但不自解释;"机制""横切"措辞;整套字母数字编码新人高门槛(与 §6 不变量编号同病) | 编号保留 + 并入下方统一可读索引;"横切"等措辞重议 | 🔶 暂定 |
| 双峰后验 BimodalPosterior | M7.uq 输出形态:双峰重尾贝叶斯后验 | 真统计术语、内部/工程准;面向用户时难懂 | 内部保留;产品面向时通俗化展示 | ✅ |
§6.C 代码 / 工程内部术语(逐条已过)
| 词 | 原意 | 病 | 裁决 | 状态 |
|---|---|---|---|---|
StructuredCognitionResult、posterior、slow_thinking / 慢思考 | 认知核单次综合结果对象 / 贝叶斯后验 / 系统二式深思路径(借 Kahneman) | 英文自解释代码标识,或借自公认概念,直白 | 保留 | ✅ |
s1、组件 N(1–14)、阶段 N(0–4) | S1 子流程代码名 / 蓝图骨架 14 组件编号 / 建造顺序阶段编号 | 编号指向散落私有索引(要读蓝图才知"组件 9=主动性""组件 14=问责");"阶段 3"定义本身还在漂(SSOT 待你定) | 编号保留 + 引用处带名 + 并入统一可读索引;"阶段 3"待你拍 | 🔶 暂定 |
kelly / kelly_cap | 已退役的凯利上限硬约束(ADR-021) | 残留三种:① eval-harness D6/D11 公式仍带活 C_kelly 项(§4.8 故意留账,权重归一属评测契约,待 FinTecEval/owner);② m1_5/m1_6 链到已退役 MP-3 未标注;③ 其余退役记录/边界声明 | ①留 FinTecEval/owner;②术语回写时补"已退役"标注;③保留作 audit trail | ✅ 已退役、传播待尽 |
§6.D grind 的头号系统性发现:编号体系缺一份可读索引
跑完全量,最大的系统性病不是某个词,而是一整套字母/数字编号散落各处、各指一份私有索引:I-NN'(不变量,还带撇号)、组件 N、阶段 N、M1–M8、S1、MCA、L/D/S、CM。每一个单看都有定义,但新人或新 Agent 撞上 test_i16_*.py、docstring 里的"组件 9""M7.uq""按 MCA 桶分层"时,得满仓找定义。单条最高价值的修法 = 建一份「编号 → 人话 → 事实源」总索引(一处可查所有编码体系),各编号本身不必改、但引用处尽量带名。这条覆盖了上面多个 🔶。
§7 定稿:全部已与 owner 对齐(2026-06-05)
§6 的 🔶 全部拍定,最终口径如下:
FinBayes 核心词
- 问责 / 可问责 → 退役,拆「判断跟进 + 校准」,差异化白话说,不挂伞形标签。
- 三态结算 / 校准账本 → 「判断跟进」两层验证枚举(§5.2)+「校准记录」。
- 交易行动前检查 → 交易决策参考材料(修「检查」词性错位、且不让 FinBayes 站进「决策者」位——「交易决策」是用户的、材料是 FinBayes 的;经原 ADR 决议,须走 ADR 改)。
- 认知材料 → 保留("材料" 是刻意的"我供料、你决策"框架)。
- 金融认知体系五件套 → 金融认知体系,构成开放描述(体系本就动态演进,不写死数字)。
治理四词
- CM → 退缩写,正文写 Commons 资产。
- escalation / 升级 → 中文改 上报裁决(英文 escalation 保留)。
- L / D / S layers → 「颗粒」改「层级」,字母保留作简写、首次带词(战略层 L / 设计层 D / 执行层 S);⚠ 待查
L与文档层级L0–L4的L是否撞名。 - Readiness 两条 → 合并一条。
MCA / 机制措辞
- MCA「横切维度 / 桶」→ 市场结构分轴(7 分轴)/「按市场结构分组」;代码留
MCA+ 索引带全称。 - 「横切」→ 跨机制(S1 = 跨机制一致性校验)。
统一编号命名规范
- 去隐晦标点(撇号
'首当其冲);类型不进 ID、进索引列。 - 形如
可读前缀-编号;引用处首次必带展开名。 - 真改 ID 的只有不变量
I-NN'→INV-NN(碰代码,交工程会话);M1–M8/S1/D1–D11/组件/阶段 不改 ID,靠「首次带名 + 索引」达到看得懂。 - 建《代号与编号索引》(§6.D),收全 INV / 组件 / 阶段 / M / S / D / MCA / L·D·S / CM / MP / ADR:代号 → 人话 → 事实源。
阶段 3
- 术语:阶段带描述名。实质:阶段 3 = 加固与可用化;判断跟进 + 校准(原「问责」)移出编号阶段、作单独课题待"真实手感"后设计。
§8 落地步骤(写回)
- ✅ SSOT 阶段 3 漂移 + 阶段描述名已改(2026-06-05 本轮,
CURRENT-MILESTONE§1/§4/§3quater)。 - ✅ 本草稿定稿(本轮)。
- ⏳ 下一步:起 ADR 正式记录本次术语整顿(含上面全部裁定、命名规范、对 ADR-020「可问责」重新摆位、对「行动判断」弃用补「交易决策参考材料」)——
ecosystem/glossary改动须由此 ADR 经governance/change-protocol.md授权。 - ⏳ ADR 落后:写 glossary(改名 + 弃用表 + 新建《代号与编号索引》,索引需从源头抓全 16 条不变量 / 14 组件 /
M1–M8名)+ 文档措辞。 - ⏳ 碰代码的(
I-NN'→INV-NN、s1等)排最后、交工程会话(先定词、再改代码)。