跳到主要内容

FinClaw V1 Sub-Packet: Skill 命名对齐 + 三项 alignment 测试 + edge-case 决策

状态:Pending 日期:2026-05-16 Lane:Engineering / Eval Owner:Engineering Agent A + Eval Agent F Parent Packet:v1-engineering-implementation-task-packet.md 对齐 Action Item:AL-4 + AL-8 + AL-9 + AL-11

1. 目标

合并 4 项「相对独立但耦合度低」的 alignment 工作进同一 sub-packet:

  1. AL-4 Skill 命名对齐:把工程仓库 8 个 skill 与治理库 7 个 canonical Fin Skill 显式映射(重命名 or alias),并把治理库未列但工程实现的 4 个 extra skill 标注为 internal helper;
  2. AL-8 Thread refresh 不覆盖 snapshot:CognitionStore 集成测试覆盖;
  3. AL-9 Advisor budget ≤ 5 / turn:单测 + 自动降级到 follow-up turn;
  4. AL-11 edge-*.yaml 决策:Eval Review 决议 7 个 edge-* case 是否吸收为正式 V1 case,将决议落盘。

合并理由:4 项都是「engineering self-audit + 文档 / 测试小调整」类工作,每项单独切一个 sub-packet 会过度碎片化。

2. 允许读取

见 frontmatter must_read / reference_only

3. 禁止范围

  • 不修改 Skill 业务逻辑,只重命名 / alias;
  • 不在 alignment 测试中扩 V1 范围;
  • 不允许把工程仓库 7 个 edge-* case 自动「升级」为正式 case,必须走 Eval Review 决议;
  • 不在 advisor budget 校验中引入新的 advisor 类型。

4. Acceptance Criteria

AC ID验收项
AC-1 (AL-4)7 个治理库 canonical Skill 在工程仓库均有显式映射;4 个 extra skill 在 SKILL.md frontmatter 中明确标注 governance_status: internal-helper
AC-2 (AL-4)v1-governance-engineering-alignment.md §3 中刷新 8 行状态
AC-3 (AL-8)CognitionStore 集成测试:refresh thread 后旧 snapshot 仍可通过 snapshot_id 读取且字段未变
AC-4 (AL-8)测试覆盖至少 3 类 refresh trigger(user / time / counter_thesis)
AC-5 (AL-9)Advisor budget 单测:第 6 个 advisor 自动 defer 到 follow-up turn;不丢失 advisor request
AC-6 (AL-9)测试覆盖:5 advisors 通过、6 advisors 触发降级、3 advisors 不触发
AC-7 (AL-11)7 个 edge-*.yaml 每个有显式决议:吸收 / internal-only / 重写 / 删除
AC-8 (AL-11)决议记录写入 evaluation/cases/edge-cases-decision-2026-05.md,并由 Eval Review owner 签字
AC-9 (Regression)v1-evaluation-review-and-acceptance-plan.md §9A regression 跑通:6 个 V1 case 在本 sub-packet 后无 regression

5. 回写位置

6. 风险与裁决项

  • 风险 R-1:重命名 Skill 文件夹会破坏现有 import → 优先用 alias 配置(在 SKILL.md frontmatter 加 canonical_name: ...),不强制重命名物理目录;
  • 风险 R-2:Advisor budget 测试 mock 难以模拟真实 LLM 调用 → 用 fake LLMClient + counter;
  • 裁决项 J-1:7 个 edge-* case 的吸收决议由 Eval Review 主审 + 项目发起人 sign-off。

7. 与其他 Sub-Packet 的关系

  • 解除:trial sub-2(trial-start gate 前置)、skills review sub-1(Phase 1 自查依赖 skill 命名稳定);
  • 共享文件需协调:server/agent/cognition_store.py / server/agent/advisor_planner.py(与其他 sub-packet 协调;本 sub-packet 主要新增测试,不修改业务逻辑)。