跳到主要内容

FinClaw Evaluation

状态:Current FinClaw Evaluation Namespace 最后更新:2026-05-13

1. 定位

本目录承载 FinClaw 体系的评测资产。

当前覆盖:

  • FinClaw 本体;
  • FinAgents(金融智能体);
  • FinSkills;
  • FinClaw 第三方参考项目体验评测;
  • FinClaw MVP 验收、回归测试和审计;
  • report pipeline、benchmark adapter、multimodal adapter、safety adapter 等 FinClaw 相关评测维度。

当前不覆盖:

  • Data Horizon
  • AI Trading Matrix
  • Reinforcement Learning Engine;
  • Financial Expert Foundation Model;
  • 未经跨项目验证的全生态通用 case。

2. 文件

  • case-library.md:人读主规范。
  • case-schema.md:结构化 case 和 run result 草案。
  • cases/:第一批机器可读 case 文件。
  • runs/:未来结构化运行结果。
  • reports/:未来汇总评测报告。

当前汇总报告:

  • reports/first-batch-reference-cross-analysis.md:第一批四个第三方参考项目横向对比、吸收判断和 FinClaw 方案设计建议。

3. 使用规则

projects/finclaw/reference-experience/ 下的参考项目评测报告应引用本目录的 case library,而不是在 reference 目录内维护独立标准。

第一版产品对象和评测字段的当前承接关系:

内容当前承接位置
产品定义与边界projects/finclaw/product-definition.mdprojects/finclaw/mvp-product-definition.md
产品对象与顾问设计projects/finclaw/design/foundation/product-object-and-advisor-design.md
术语与对象命名projects/finclaw/design/foundation/terminology-and-object-naming.md
结构化评测字段case-schema.md
机器可读用例cases/

参考体验报告和来源分析只作为证据层,不再作为 FinClaw 产品定义的并列入口。

若某个 case 被证明能稳定服务 FinClaw 之外的独立项目,先在对应项目命名空间复用验证,再考虑上移到 evaluation/shared/