FinClaw Evaluation
状态:Current FinClaw Evaluation Namespace 最后更新:2026-05-13
1. 定位
本目录承载 FinClaw 体系的评测资产。
当前覆盖:
- FinClaw 本体;
- FinAgents(金融智能体);
- FinSkills;
- FinClaw 第三方参考项目体验评测;
- FinClaw MVP 验收、回归测试和审计;
- report pipeline、benchmark adapter、multimodal adapter、safety adapter 等 FinClaw 相关评测维度。
当前不覆盖:
- Data Horizon;
- AI Trading Matrix;
- Reinforcement Learning Engine;
- Financial Expert Foundation Model;
- 未经跨项目验证的全生态通用 case。
2. 文件
case-library.md:人读主规范。case-schema.md:结构化 case 和 run result 草案。cases/:第一批机器可读 case 文件。runs/:未来结构化运行结果。reports/:未来汇总评测报告。
当前汇总报告:
reports/first-batch-reference-cross-analysis.md:第一批四个第三方参考项目横向对比、吸收判断和 FinClaw 方案设计建议。
3. 使用规则
projects/finclaw/reference-experience/ 下的参考项目评测报告应引用本目录的 case library,而不是在 reference 目录内维护独立标准。
第一版产品对象和评测字段的当前承接关系:
| 内容 | 当前承接位置 |
|---|---|
| 产品定义与边界 | projects/finclaw/product-definition.md、projects/finclaw/mvp-product-definition.md |
| 产品对象与顾问设计 | projects/finclaw/design/foundation/product-object-and-advisor-design.md |
| 术语与对象命名 | projects/finclaw/design/foundation/terminology-and-object-naming.md |
| 结构化评测字段 | case-schema.md |
| 机器可读用例 | cases/ |
参考体验报告和来源分析只作为证据层,不再作为 FinClaw 产品定义的并列入口。
若某个 case 被证明能稳定服务 FinClaw 之外的独立项目,先在对应项目命名空间复用验证,再考虑上移到 evaluation/shared/。