跳到主要内容

FinClaw Case Library Adapter Upgrade Handoff

状态:Batch 3 / Case Library Adapter and FinRobot Retest Closed 日期:2026-05-11 角色:FinClaw Program Controller

本批范围

本批更新知识库文档,并完成 FinRobot report pipeline 重测。不改 FinClaw 工程代码,不独立新建工具仓库。

已更新:

  • evaluation/finclaw/case-library.md
  • evaluation/finclaw/case-schema.md
  • projects/finclaw/reference-experience/finrobot-evaluation.md
  • packets/sync/finclaw-reference-experience-2026-05-09/INDEX.md

结论

case-library.md 已从 V1 升级为 V1.1,并已移除不直观的内部缩写式 case family。当前 case 命名改为维度化、矩阵化、可读化:

  • Access-Baseline-*
  • Cognition-Matrix-*
  • Real-Chat-*
  • Report-Pipeline-*
  • Benchmark-Financial-*
  • Multimodal-*
  • Safety-*

该层不替代 Cognition-Matrix-* / Real-Chat-* 真实体验主线,也不扩大 FinClaw MVP 产品边界。

关键设计

  1. Case Library 仍保留为人读的主规范。
  2. case-schema.md 定义结构化 case 和 run result 草案。
  3. 暂不立即独立成新仓库。
  4. 已完成 FinRobot report pipeline 重测,旧 targeted plan 已删除,当前结论收敛到 finrobot-evaluation.md
  5. Case Library 当前正式入库位置已调整为 evaluation/finclaw/;该目录属于生态级评测区,但当前命名空间仍限定为 FinClaw 体系。待结构化 cases、runs、轻量 runner 和跨项目适配稳定后,再判断是否上移到 evaluation/shared/ 或独立为生态评测工具仓库。

Resume Point

下一批建议执行 “FinRobot Evaluation Cross-Project Comparison”:

  1. 只读取 case-library.mdReport-Pipeline-* 小节和 finrobot-evaluation.md
  2. 使用当前 run 目录 FINROBOT_REPORT_PIPELINE_RETEST 的报告和日志作为证据。
  3. 将 FinRobot 与前三个参考项目按 case family 做横向对比。
  4. 不再读取旧 FinRobot run 目录或旧 targeted plan。