跳到主要内容

FinClaw V1 Sub-Packet: Skills Domain Review Phase 1 — AI Self-Audit

状态:Pending / 等待 sub-packet engineering sub-7 完成(Skill 命名稳定) 日期:2026-05-16 Lane:Product / Eval Owner:FinClaw Controller 分发,AI Coding Agent(Cursor / Codex)执行 Parent Packet:v1-skills-domain-knowledge-review-task-packet.md 对齐决策:v1-engineering-kickoff-decisions.md D-11

1. 目标

按 D-11 决议执行 Phase 1:基于 4 个参考项目(aifinlab / Chelae / martinpmm / FinRobot)的现成分析报告,对 7 个 Fin Skills + 6 个 Advisors 做领域 baseline 自查

本 sub-packet 由 AI Agent 自治完成,不需要外部金融专家参与;它的产出是 Phase 2 外部专家评审的输入与对照基线。

2. 允许读取

见 frontmatter must_read / reference_only

3. 禁止范围

  • 不替代 Phase 2 外部专家评审(v1-skills-review-sub-2-phase2-external-expert-review.md);
  • 不让 AI 自查结论充当「专家背书」(必须明确标注 Phase 1 = AI baseline,非专家结论);
  • 不修改 Skills / Advisors 实现(review packet §3 不允许评审人代写 prompt);
  • 不在自查中引入 4 个参考项目以外的「证据」(避免 hallucinated benchmark)。

4. Acceptance Criteria

AC ID验收项
AC-17 个 Fin Skills 每个都有 baseline 自查 grade(A / B / C / D)+ 失败 examples ≥ 2 + suggested improvements
AC-26 个 Advisors 每个都有同样输出
AC-36 个 V1 Evaluation Cases 每个都有 realism + expected_answer_alignment 自查 grade
AC-4自查 yaml 严格符合 v1-skills-domain-knowledge-review-packet.md §5 deliverables 模板,文件名前缀为 _phase1- 表明非外部评审
AC-54 个参考项目 evaluation 报告每个都被引用 ≥ 1 次(保证不是凭空打分)
AC-6Summary 报告 _phase1-summary.md 含:top-3 risk skill / advisor、top-3 strong skill / advisor、与 Phase 2 评审的对照预期
AC-7任一 Skill / Advisor / Case 自查 grade = D → 不直接 block trial-start,但必须升级到项目发起人 + 提前给 Phase 2 评审人加 priority focus
AC-8回写治理库相关 Open Items(v1-agent-orchestration-design.md §13 / v1-evaluation-initial-plan.md §10

5. 回写位置

  • AI 自查 yaml + summary → 治理库 evaluation/finclaw/reports/skills-domain-review/_phase1-*
  • Open Items 回写 → 治理库对应 design doc;
  • Hand-off anchor → handoff-anchors/v1-skills-review-sub-1-phase1-ai-self-audit.yaml
  • 解除依赖:trial sub-1 / sub-2(Phase 1 自查作为 trial-start 前置 quality signal,但不强制 grade ≥ B); Phase 2 sub-packet(sub-2 在 trial 跑过 ≥ 6 份样本后启动,可参考 Phase 1 baseline 调整 review focus)。

6. 风险与裁决项

  • 风险 R-1:AI 自查与 Phase 2 专家结论分歧大 → 这是预期的;分歧本身是 Phase 2 的输入;不强行调和;
  • 风险 R-2:4 个参考项目报告本身可能过时 → AI 自查必须显式标注「基于 2026-05 之前的报告」;
  • 裁决项 J-1:Phase 1 grade = D 是否阻塞 trial-start 由项目发起人裁决(D-11 默认不阻塞)。

7. 与其他 Sub-Packet 的关系

  • 依赖:v1-eng-impl-sub-7-skill-naming-and-tests.md(Skill 命名稳定);
  • 解除:phase 2 sub-packet(提供 baseline)、trial sub-1(provide quality signal);
  • 共享文件:无(output 在治理库新目录,不与 Engineering 仓库冲突)。