跳到主要内容

Step 4 · Codex 扮演 Claude 治理 / 架构 reviewer 独立 review

0. 角色切换声明

本次 review 刻意脱离 Codex 工程实施视角,不评判 Pydantic 字段、fixture、token load、C-1 代码卡点,也不重复 Step 3 Codex 的实现可行性判断。我以 Claude 治理 / 架构 reviewer 角色看这组文档:决策是否有 ADR audit trail、跨工作流交接是否可续接、同号不同物是否可消歧、待拍板项是否有归口,以及工程化期间 Claude 主控如何守住治理边界。

1. 执行摘要

【Inference】文档包已能支撑 M0 启动,Claude Step 3 已覆盖多数治理风险;本轮未发现新增 C-1 前 P0。新增盲点集中在“状态账本”:主架构 ADR 索引未吸收跨工作流同号现实,sync plan 依赖状态滞后,promoted proposal 仍留在 inbox,认知研究 status 有 stable / Phase 9 轻微冲突。建议 C-1 继续,M0 期间补治理账本整理。

2. 五维度评分表

维度分数Evidence / Inference
ADR audit trail 清晰度4.0 / 5【Evidence】ADR-007 supplement frontmatter 明确 supplements / supersedes / related-adrs / superseded-by-prep,并写明持续构建状态:governance/workstreams/finbayes-cognition-system-research/decisions/ADR-007-supplement-金融认知体系第一版正式构成.md:9-15;ADR-008 supplement 明确 supplements、同号 ADR 消歧、proposal 来源:governance/workstreams/finbayes-whitepaper-rewrite/decisions/ADR-008-supplement-机制层输出契约扩展.md:9-15:22-27。【Inference】核心 supplement 链路强,但主架构 §23 的 ADR 索引仍按本地 ADR-NNN 全局唯一描述,未承接跨工作流同号 ADR 现实,扣 1 分。
跨工作流 hand-off 清晰度3.8 / 5【Evidence】pre-engineering readiness 把 3 个核心工作流和交付状态汇总为单点入口:governance/workstreams/finbayes-arch-rewrite/2026-05-28-pre-engineering-readiness.md:100-107:237-239;cognition status 声明 hand-off 至 arch-rewrite:governance/workstreams/finbayes-cognition-system-research/status.md:12-14。【Evidence】但 downstream sync status 仍有 v3 R1 清单“待开工”,ADR-007 sync “Phase 1 进行中”:governance/workstreams/finbayes-whitepaper-v3-downstream-sync/status.md:39-44。【Inference】可续接,但 active / stable / post-stable-addition 三类状态还需要一张收口账本。
跨文档一致性4.0 / 5【Evidence】4 子系统 README 把 ADR-007 / ADR-008 supplement 的行为契约与工程契约拆清楚,并禁止重复字段定义:projects/finbayes/engineering/subsystems/README.md:35-50;主架构 §29 只放索引,字段事实源回指 ADR-008 supplement:projects/finbayes/engineering/architecture.md:5980-6007:6036-6042。【Inference】语义主链一致;剩余问题主要是 status / index 元数据滞后,不是核心概念冲突。
待拍板归口路径3.7 / 5【Evidence】入口汇总聚合 ADR-008、评测公式、data-providers、data-splits、B-1 共 27 项待拍板:governance/workstreams/finbayes-arch-rewrite/2026-05-28-pre-engineering-readiness.md:193-221;data-providers 明确 4 处待补 ADR:projects/finbayes/engineering/engineering-packs/data-providers.md:164-169;data-splits 明确首季评估拍板:projects/finbayes/engineering/engineering-packs/data-splits.md:104-106。【Inference】清单够全,但“谁拍 / 哪个工作流改 / 是否出 ADR”的路由尚未压成一页操作表。
工程化治理张力承接3.8 / 5【Evidence】ADR-003 定义 Claude spec/review、Codex 实施、确定性 gate、fresh eyes 原则:governance/workstreams/finbayes-arch-rewrite/decisions/ADR-003-工程实施栈与协作.md:27-40;anti-bloat guard 给出 80 行拆分和 M0 收尾阈值:projects/finbayes/engineering/architecture-anti-bloat-guard.md:17-27:42-57。【Inference】角色分工与防膨胀已有硬约束;PR review checklist、代码/ADR 微差异归口已被 Claude Step 3 发现,本轮新增的是“治理账本 drift”需要纳入 review checklist。

3. Claude Step 3 没看到的发现

F1 · 主架构 ADR 索引没有吸收跨工作流同号 ADR 的现实

【Evidence】主架构 §23 定义 ADR 编号为“三位数字,全局唯一,不重用”,位置限定在 finbayes-arch-rewrite/decisionsprojects/finbayes/engineering/architecture.md:4646-4656。同一文档 accepted 表只列本工作流 ADR-001/002/003/004/008/010:projects/finbayes/engineering/architecture.md:4660-4669。但 ADR-008 supplement 已明确存在 whitepaper-rewrite 的 ADR-008 主体与 arch-rewrite 的 ADR-008 Provider“同号不同物”:governance/workstreams/finbayes-whitepaper-rewrite/decisions/ADR-008-supplement-机制层输出契约扩展.md:22-27

【Inference】Claude Step 3 已看见“同号 ADR 消歧只在 ADR-008 supplement 一处显式说明”,但没指出主架构 §23 仍在传播“局部编号 = 全局唯一”的旧模型。新人从主架构入口读 ADR 时,可能误以为 ADR-NNN 是全仓唯一,而不是 workstream namespace 内唯一。

F2 · downstream sync plan 的依赖状态滞后于 readiness 汇总

【Evidence】sync plan 仍写“L3 架构 ADR-008 supplement 起草未完成”,并说 Phase 3 等待 ADR-008 supplement 架构起草进展:governance/workstreams/finbayes-whitepaper-v3-downstream-sync/sync-plan-adr007-supplement.md:62-65:73-79。但 readiness 已把 ADR-008 supplement 标为新增 accepted 资产,并把 whitepaper-rewrite 推进点列为 ADR-008 supplement accepted:governance/workstreams/finbayes-arch-rewrite/2026-05-28-pre-engineering-readiness.md:68:104-106

【Inference】这不是契约冲突,而是 hand-off 状态账本未回写。若 Claude 主控从 sync plan 继续,会重复等待已完成依赖,或把 P1 下游同步错误延后。

F3 · promoted proposal 仍物理留在 inbox,和“归档”表述有轻微不一致

【Evidence】readiness §2.8 称 inbox proposal 归档,frontmatter 标 promoted、promoted_to 指向 ADR-008 supplement:governance/workstreams/finbayes-arch-rewrite/2026-05-28-pre-engineering-readiness.md:109-112。实际文件仍位于 governance/proposals/inbox/,frontmatter 自身也写“待按归档惯例 git mv 进 accepted/2026/”:governance/proposals/inbox/2026-05-28--finbayes-cognition-mechanism-output-extension-to-adr008.md:6-10

【Inference】Claude Step 3 把 inbox → accepted 路径视为已有 trace,但未区分“逻辑 promoted”与“物理归档未完成”。inbox 混有已 promoted 项,会让 reviewer 误判仍待处理。

F4 · cognition-system-research status 同时声明 stable 完成与 Phase 9 待启动

【Evidence】frontmatter 和当前状态称 completed / stable,Phase 0-9 全程完成:governance/workstreams/finbayes-cognition-system-research/status.md:1-14:18-23。同一文件 Phase 表却写 Phase 9 复盘 + meta-playbook 反馈为“待启动”:governance/workstreams/finbayes-cognition-system-research/status.md:50-63

【Inference】这不是工程阻塞,但会削弱 audit trail 时间线可信度:若 Phase 9 属于 completion,则不应 stable;若是后置复盘,则“Phase 0-9 全程完成”应改为“Phase 0-8 完成,Phase 9 后置”。

F5 · 27 项待拍板的“归口路径”散在多文档,缺少一张 owner 表

【Evidence】readiness 聚合 27 项待拍板:governance/workstreams/finbayes-arch-rewrite/2026-05-28-pre-engineering-readiness.md:193-221;cognition-1.1-contract 另列具体未锁定项:projects/finbayes/engineering/engineering-packs/cognition-1.1-contract.md:338-344;MCAClassifier 已给 worst_axis v1 排序与边界兜底:projects/finbayes/engineering/subsystems/mca-classifier.md:142-144;data-providers 要独立 ADR:projects/finbayes/engineering/engineering-packs/data-providers.md:164-169

【Inference】Claude Step 3 已做分类,但未指出“分类结果尚未回写为正式 owner map”。这些归口建议仍停留在 review 报告里,不是事实源;C-1 若出现字段语义争议,Agent 仍要人工拼接多份文档。

4. 治理张力点与应对策略

张力点Evidence / Inference应对策略
状态账本 drift:stable、active、post-stable-additions 同时存在【Evidence】arch-rewrite stable 但有 post-stable additions:governance/workstreams/finbayes-arch-rewrite/status.md:1-12;downstream sync 仍 active:governance/workstreams/finbayes-whitepaper-v3-downstream-sync/status.md:1-19。【Inference】不是坏事,但需要一个“哪个账本为准”的规则。把 pre-engineering-readiness 定为 2026-05-28 M0 准入 snapshot;各 status 只记录生命周期,依赖完成状态回写到各自 status / sync plan。
ADR namespace 张力:局部编号传统 vs 跨工作流同号现实【Evidence】主架构 §23 定义全局唯一:projects/finbayes/engineering/architecture.md:4648-4652;ADR-008 supplement 明示同号不同物:governance/workstreams/finbayes-whitepaper-rewrite/decisions/ADR-008-supplement-机制层输出契约扩展.md:14:26建立命名规则:外部引用写 workstream/ADR-NNN,主架构 §23 加“本索引为 arch-rewrite namespace”。
Proposal 生命周期:promoted 与 accepted physical archive 分离【Evidence】proposal 仍在 inbox 且写待 git mv:governance/proposals/inbox/2026-05-28--finbayes-cognition-mechanism-output-extension-to-adr008.md:6-10M0 启动前不阻塞;M0 治理整理时执行物理归档,或者在 inbox README 明确 promoted 文件允许暂存。
Accepted supplement 持续构建承接【Evidence】ADR-007 supplement 明确 vN+1 由 Phase 5 触发:governance/workstreams/finbayes-cognition-system-research/decisions/ADR-007-supplement-金融认知体系第一版正式构成.md:141-158:201-217维持 Claude Step 3 建议:C-1 不触发 v2;但把 F4 的 Phase 9 状态修正纳入 audit trail 清洁项。
新成员上手成本:入口多而账本多【Evidence】readiness 给 6 角色阅读路径:governance/workstreams/finbayes-arch-rewrite/2026-05-28-pre-engineering-readiness.md:22-31:146-191在 review checklist 里加一项“先读 readiness snapshot,再查对应 status;不从旧 sync plan 推断当前完成度”。

5. 待拍板归口建议

归口类别数量代表项建议路径
必拍4phase_label 枚举具体清单、edges.form 封闭性、regulation_status None / 空对象语义、kelly_cap 下游消费协议【Inference】C-1 期间若触发,直接补 ADR-008 supplement audit trail;不另起新 ADR。
自然解决12Phase 4 评测公式 8 项、data-splits 4 项【Evidence】eval formulas 标 R2 校准项:projects/finbayes/engineering/engineering-packs/eval-harness-formulas.md:222;data-splits 标首季评估拍板:projects/finbayes/engineering/engineering-packs/data-splits.md:104-106。【Inference】走 Phase 5 首季 / R2 mini-review,不挡 M0。
直接出 ADR5data-providers 4 项 + ADR namespace / StructuredCognitionResult 架构层核心契约索引规则【Evidence】data-providers 明确 4 项待补 ADR:projects/finbayes/engineering/engineering-packs/data-providers.md:164-169;whitepaper ADR-008 主体早已提议补架构层 StructuredCognitionResult 独立 ADR:governance/workstreams/finbayes-whitepaper-rewrite/decisions/ADR-008-战略层与架构层关于结构化认知输出的对齐.md:20:84-85
先清账本、不拍新决策4F1 主架构 ADR 索引 namespace、F2 sync plan 依赖状态、F3 proposal 物理归档、F4 Phase 9 状态【Inference】这些是 audit trail hygiene,不需要产品/架构新拍板。

6. 与 Claude 视角差异分析

Claude Step 3 更擅长读出“未来 PR review 会发生什么治理张力”:PR checklist、代码 vs ADR 微差异、accepted 持续构建、团队上手路径。我的 Step 4 更偏“账本 / 状态机一致性”:同一事实在 status、sync plan、proposal、主架构 ADR index 中是否同步。两者不冲突:Claude 抓 reviewer 行为,Codex 抓文档治理生命周期 drift。

【Evidence】Claude Step 3 已列 PR checklist、代码 vs ADR 归口、持续构建、hand-off 反向触发、新人成本、ADR index 粒度等:governance/workstreams/finbayes-arch-rewrite/2026-05-28-step3-claude-review.md:125-135:151-172。【Inference】本报告刻意不重复这些项,只把“仍没看到”的账本 drift 和 namespace 规则缺口前置。

7. 元 review:同一角色下的跨模型认知差异

【Inference】同一角色下,Claude 更像主控 reviewer:从工程化现场倒推哪些 checklist 能减负;Codex 更像 audit trail checker:从文件状态、frontmatter、status 生命周期和索引规则找不可续接点。Claude 的风险是把已知工作流语境当默认背景;Codex 的风险是把元数据滞后看得过重。最佳组合是 Claude 管 reviewer 操作面,Codex 定期扫 status / ADR / proposal / index 的账本一致性。

8. 最终判断

【Inference】M0 C-1 不应因本轮新增发现暂停;新增问题没有触及核心契约语义,也没有改变 ADR-007 / ADR-008 supplement 的事实源地位。建议把本报告作为 M0 治理清账输入:先修 F2/F3/F4 三个状态账本小项,再把 F1/F5 纳入 Step 3 已建议的 PR review checklist / ADR INDEX 工作中。