L3 §20–21 双路评审汇总 + 修订记录
两路独立评审(CC + Codex)均逐文件核对实际代码,收敛 + 互补。CC 主笔据收敛项修订。
收敛/互补必修 → 已修
| # | 问题 | CC | Codex | 修订 |
|---|---|---|---|---|
| F1 | §20「约 10+ test」夸大,掩盖主链路(job/agent)零测试 | B1 | nb | 据实:11 个偏工具层;新增「主链路 internal/job//agent 零 test」重缺口行 |
| F2 | §20 五条验收未列每条现状/缺口 | — | blocking#2 | 补「现行五条覆盖均不足、是测试债」+ §22/§28 锚 |
| F3 | §21 统一质量视图漏资产状态底座 | — | blocking#3 | 补「三表是运行日志,dn_raw_news 是资产状态底座」 |
| F4 | §21 mermaid FinBayes 与 ATM 并列 | — | nb | 标 FinBayes(P4 后置) |
| F5 | §21「对应 FinBayes 评估闭环位置」易误读为替代 | — | nb | 改「相邻位置 + 不替代认知评估」 |
| F6 | §20 契约测试 ADR-04(交付)vs 最小契约口径 | N2 | — | §20 契约行拆「最小契约 WP-P1-02 / 交付契约 ADR-04」 |
| F7 | §20 pkg/llm test 是 provider 选择非 LLM 质量 | N1 | nb | 据实括注 |
| F8 | §20 测试数据来源 | N4 | — | 承接 DH-WP-001 S0 导出脱敏样本 |
| F9 | §20 S1–S8 与 L2 场景名映射 | — | blocking#1 | §20 端到端行标「S1–S8(§6/§10,承接 L2 §15.1)」(完整映射留 §22/§28) |
亮点(两路共识)
- 反馈缺口三处与代码逐字吻合(webhook 仅 received、MaxRetryCount 无调用方、retry_count 恒 0、无置信字段)。
- FinBayes 边界干净(评感知质量、不评认知);透明名(「质量与反馈闭环」非照搬「评估闭环」)。
- §15↔§11.6↔§21 协调点闭环自洽;L2 §12 五条 + gap-map WP 标签逐条对得上。
- §20 未写死框架/覆盖率/阈值,守工程层。
方法
窄 Codex 连续三部成功规避 compaction;CC 抓「主链路零测试」、Codex 抓「资产状态底座 / 场景锚定」,互补显著。