aifinlab-FinClaw 技能层评测
状态:Batch 7 / Track A6 MVP 产品对象草案完成
对象:/Users/mlabs/Programs/aifinlab-FinClaw
角色:FinClaw Program Controller
1. 为什么需要单独评测
aifinlab/FinClaw 与 martinpmm、Chelae 的主要差异不在“回答是否像金融助理”,而在它更接近 OpenClaw 金融技能层:
- 六大精选金融套件:银行、证券、基金、期货、保险、信托;
skillsChoice/下 60 个精选 skills;skills/下大规模金融 skills root;- Docker/OpenClaw Agent 可用,但技能层覆盖面、可执行性和 taxonomy 是该项目的核心参考价值。
因此,不能只用 Cognition-Matrix-* / Real-Chat-* chat-agent 横向表评价它。需要单独建立“技能层评测”线。
2. Batch 1 盘点
低上下文盘点结果:
| 项目 | 数量 / 发现 |
|---|---|
skillsChoice/*-suite/*/SKILL.md | 60 |
| bank-suite | 10 |
| securities-suite | 10 |
| fund-suite | 10 |
| futures-suite | 10 |
| insurance-suite | 10 |
| trust-suite | 10 |
skills/*/SKILL.md 大写 OpenClaw 标准文件 | 982 |
skills/*/skill.md 小写额外文件 | 40 |
| 本地大小写不敏感文件系统中的 root skill-like 条目 | 1022 |
带 scripts/ 或 script/ 目录的 root 条目 | 631 / 1022 |
计数说明:macOS 默认大小写不敏感,Python glob('*/SKILL.md') 会同时匹配 SKILL.md 和 skill.md。OpenClaw 标准口径应优先使用大写 SKILL.md = 982;做仓库内容盘点时可记录 982 + 40 个小写文件 = 1022。
3. 60 个精选技能
bank-suite
bank-credit-analyzer, bank-deposit-rates, bank-financial-analyzer, bank-industry-analyzer, bank-interbank-market, bank-liquidity-analyzer, bank-nim-analyzer, bank-risk-analyzer, bank-valuation-analyzer, bank-wealth-products
securities-suite
securities-am-analyzer, securities-brokerage-analyzer, securities-financial-analyzer, securities-ib-analyzer, securities-industry-analyzer, securities-margin-analyzer, securities-policy-analyzer, securities-proprietary-analyzer, securities-rating-analyzer, securities-valuation-analyzer
fund-suite
fund-attribution-analysis, fund-holding-analyzer, fund-market-research, fund-monitor, fund-portfolio-allocation, fund-rebalance-advisor, fund-risk-analyzer, fund-screener, fund-sip-planner, fund-tax-optimizer
futures-suite
commodity-futures-analyzer, financial-futures-analyzer, futures-arbitrage-analyzer, futures-delivery-analyzer, futures-macro-correlation, futures-margin-calculator, futures-market-overview, futures-position-tracker, futures-risk-analyzer, futures-volume-analyzer
insurance-suite
insurance-company-analyzer, insurance-hot-events, insurance-investment-analyzer, insurance-life-analyzer, insurance-market-overview, insurance-pc-analyzer, insurance-policy-tracker, insurance-sector-comparison, insurance-solvency-analyzer, insurance-valuation-analyzer
trust-suite
charity-trust-manager, family-trust-designer, trust-asset-allocation, trust-compliance-checker, trust-income-calculator, trust-market-research, trust-post-investment-monitor, trust-product-analyzer, trust-risk-manager, trust-valuation-engine
4. Root Skills 初步分桶
基于目录名的低成本归类,不代表最终 taxonomy:
| 分桶 | 近似数量 |
|---|---|
| A-share market / quant / strategy | 174 |
| Bank / banking workflows | 135 |
| Client / sales / marketing / roadshow | 64 |
| Risk | 52 |
| AkShare data / risk utilities | 33 |
| Legal / compliance / regulatory / filing | 28 |
| Fund | 27 |
| Global retrieval / product / scenario utilities | 26 |
| Trust | 23 |
| Portfolio | 14 |
初步判断:root skills 覆盖的不只是投研分析,还包括银行公司金融、财富管理、风控、合规、基金销售、客户沟通、监管材料、尽调、产品适配等大量金融机构工作流。
5. 建议评测路径
Track A:60 个精选技能完整 Smoke
优先级最高。逐个验证 60 个精选 skills:
- OpenClaw 是否能发现;
SKILL.md是否有清晰触发词和能力边界;- 是否有 script entry;
--help/ mock / minimal sample 是否可执行;- 依赖是否完整;
- 输出是否结构化;
- 数据源失败时是否透明降级。
产出:aifinlab-skillschoice-smoke-results.md。
Track B:Root Skills Taxonomy 审计
不逐个全文阅读。先抽取 metadata / 目录名 / 脚本存在性 / requirements / references:
- 分类;
- 声明能力;
- 是否可执行;
- 数据源 / 依赖;
- 是否面向金融机构内部工作流;
- 与 FinClaw MVP cognition chain 的关系。
产出:aifinlab-root-skills-taxonomy.md。
Track C:分层深度抽样
从 root skills 每类抽样,不直接全量运行 1000+:
- A-share / quant / strategy;
- bank workflow;
- fund sales / compliance;
- risk / regulatory;
- trust / wealth;
- global retrieval / product matching;
- document / due diligence / legal QA。
产出:aifinlab-root-skills-deep-sampling.md。
6. 判断标准
| 判断 | 含义 |
|---|---|
| 可直接复用 | 可直接作为参考技能样式或体验机制。 |
| 重设计后可复用 | taxonomy / workflow 有价值,但实现或边界需要重写。 |
| 仅作参考 | 只作为领域覆盖或命名参考,不吸收执行方式。 |
| 排除 | 质量、边界、依赖或产品方向不适合 FinClaw。 |
7. Batch 1 结论
有必要对 aifinlab/FinClaw 做区别于 martinpmm / Chelae 的深度技能层评测。当前 chat case rerun 只验证了 OpenClaw Agent 对自然语言金融认知的承接能力;它没有覆盖该项目最有价值的 60 精选 skills、六大金融套件和 982/1022 root skill ecosystem。
下一批建议执行 Track A:60 selected skills full smoke。
8. Batch 2 / Track A1:精选技能入口 Smoke
执行时间:2026-05-11
执行环境:
- Docker container:
aifinlab-finclaw-openclaw - 容器仓库:
/home/node/.openclaw/workspace/FinClaw - 主机仓库:
/Users/mlabs/Programs/aifinlab-FinClaw - 范围:
skillsChoice/*-suite/*/scripts/main.py --help - 超时:35 秒 / skill
- PYTHONPATH:
/home/node/.openclaw/workspace/FinClaw/skillsChoice/common/home/node/.openclaw/workspace/FinClaw/skillsChoice/fund-suite/data/home/node/.openclaw/workspace/FinClaw/skillsChoice/trust-suite/data
本批 smoke 只验证精选技能脚本入口是否能在容器内加载、解析参数并输出 help,不运行真实市场数据拉取、数据更新、报告生成或外部执行动作。
容器内补齐的 requirements 依赖:
cvxpy, jsonschema, matplotlib, networkx, plotly, pydantic, scipy, statsmodels, tushare
结果汇总:
| 套件 | 总数 | 通过 | 通过但有警告/降级 | 失败 |
|---|---|---|---|---|
| bank-suite | 10 | 10 | 0 | 0 |
| fund-suite | 10 | 10 | 0 | 0 |
| futures-suite | 10 | 10 | 0 | 0 |
| insurance-suite | 10 | 10 | 0 | 0 |
| securities-suite | 10 | 10 | 0 | 0 |
| trust-suite | 10 | 9 | 0 | 1 |
| Total | 60 | 59 | 0 | 1 |
失败项:
| 套件 | 技能 | 失败原因 |
|---|---|---|
| trust-suite | charity-trust-manager | NameError: name 'Optional' is not defined at class definition, before argparse help can render. |
原始产物:
packets/sync/finclaw-reference-experience-2026-05-09/logs/aifinlab-20260511-skillschoice-smoke-run/run_skillschoice_smoke.pypackets/sync/finclaw-reference-experience-2026-05-09/logs/aifinlab-20260511-skillschoice-smoke-run/skillschoice-smoke-results.jsonlpackets/sync/finclaw-reference-experience-2026-05-09/logs/aifinlab-20260511-skillschoice-smoke-run/aifinlab-skillschoice-smoke-results.md
安全检查:
- 未发现 API key、provider endpoint 或已知密钥片段写入本批 smoke 日志。
- 本批未触发真实交易、生产消息渠道、私钥或外部执行权限。
9. Batch 2 结论
skillsChoice 60 个精选技能的入口完整性较高:59/60 能在 Docker/OpenClaw 容器中完成脚本加载和 help 渲染。唯一失败项是局部 Python 类型导入缺失,属于代码质量 / 可执行性问题,不影响对该项目技能层覆盖面的总体判断。
下一批建议不要立即扩大到 root 982/1022 skills;应先对 60 selected skills 做 Track A2 的 minimal sample / mock-data 执行分层:
- 优先选择明确支持
--use-mock-data、--json或纯计算输入的 skills; - 对需要真实行情、Tushare token、AkShare 网络访问或数据更新的 skills 单独标记;
- 将输出结构、数据失败降级、中文金融术语质量和 suite 间一致性纳入评分。
10. Batch 3 / Track A2:精选技能最小样例执行
执行时间:2026-05-11
执行环境:
- Docker container:
aifinlab-finclaw-openclaw - 容器仓库:
/home/node/.openclaw/workspace/FinClaw - 主机仓库:
/Users/mlabs/Programs/aifinlab-FinClaw - 范围:60 selected
skillsChoiceskills 的 minimal / mock-data / low-side-effect sample execution - 超时:55 秒 / skill
- 模型遥测:
N/A,本批为直接 Python script execution,无 LLM call,estimated tokens =0
样例选择原则:
- 优先使用
--use-mock-data、--json、纯计算参数或本地静态参数; - 对没有 mock path 的技能使用最低副作用的 overview / market / single-entity read-only 参数;
- 不连接真实交易、生产消息渠道、私钥或外部执行权限;
- A1 已失败的
trust-suite/charity-trust-manager标记为BLOCKED_BY_A1,不重复计为 A2 新失败。
结果汇总:
| 套件 | 总数 | 通过 | 通过但有警告/降级 | 失败 | 受 A1 阻塞 |
|---|---|---|---|---|---|
| bank-suite | 10 | 3 | 7 | 0 | 0 |
| fund-suite | 10 | 6 | 3 | 1 | 0 |
| futures-suite | 10 | 8 | 1 | 1 | 0 |
| insurance-suite | 10 | 3 | 4 | 3 | 0 |
| securities-suite | 10 | 3 | 3 | 4 | 0 |
| trust-suite | 10 | 7 | 2 | 0 | 1 |
| Total | 60 | 30 | 20 | 9 | 1 |
失败 / 阻塞项:
| 套件 | 技能 | 类型 | 发现 |
|---|---|---|---|
| fund-suite | fund-portfolio-allocation | code error | NameError: name 'warnings' during sample execution. |
| futures-suite | futures-margin-calculator | timeout | Timed out after 55s despite local --price; likely still enters long data path or blocking lookup. |
| insurance-suite | insurance-life-analyzer | timeout | Timed out after 55s on --market. |
| insurance-suite | insurance-market-overview | timeout | Timed out after 55s on --overview. |
| insurance-suite | insurance-sector-comparison | permission error | PermissionError: [Errno 13] Permission denied for suite data path. |
| securities-suite | securities-am-analyzer | timeout | Timed out after 55s on --overview. |
| securities-suite | securities-ib-analyzer | timeout | Timed out after 55s on --ipo. |
| securities-suite | securities-industry-analyzer | timeout | Timed out after 55s on --action overview. |
| securities-suite | securities-rating-analyzer | timeout | Timed out after 55s on --all. |
| trust-suite | charity-trust-manager | blocked | A1 entrypoint failed before argparse due missing Optional import. |
解释:
PASS表示 sample path 完成且没有明显 stderr / warning / degraded marker。PASS_WITH_WARNING表示脚本完成,但输出中出现数据源失败、降级、error 字段、progress stderr 或格式层面的 warning;这类结果对参考项目仍有价值,因为它说明技能有 fallback 或至少能给出结构化失败信息。FAIL timeout与FAIL nonzero_exit/name_error分开看:前者更多反映外部数据路径或脚本阻塞控制不足;后者是更明确的代码质量问题。
原始产物:
packets/sync/finclaw-reference-experience-2026-05-09/logs/aifinlab-20260511-skillschoice-smoke-run/run_skillschoice_minimal_samples.pypackets/sync/finclaw-reference-experience-2026-05-09/logs/aifinlab-20260511-skillschoice-smoke-run/skillschoice-minimal-sample-results.jsonlpackets/sync/finclaw-reference-experience-2026-05-09/logs/aifinlab-20260511-skillschoice-smoke-run/aifinlab-skillschoice-minimal-sample-results.md
安全检查:
- 未发现 API key、provider endpoint 或已知密钥片段写入本批 A2 日志。
- 本批未触发真实交易、生产消息渠道、私钥或外部执行权限。
11. Batch 3 结论
aifinlab/FinClaw 的 60 selected skills 不只是静态说明,已有相当比例能在容器内完成 minimal execution:30 PASS + 20 PASS_WITH_WARNING。这说明该项目的参考价值主要在“金融机构技能 taxonomy + 可执行脚本骨架 + 数据源降级模式”,而不是单纯 chat-agent 能力。
同时,A2 暴露出三类工程风险:
- 代码质量问题:缺失 import / 未定义 name / data path permission。
- 外部数据路径控制问题:部分 sample 在 55 秒内无法完成,说明需要更明确的 offline/mock mode 或内部超时。
- 数据质量表达不一致:部分输出能透明说明模拟 / fallback / N/A,部分输出只表现为长等待或 timeout。
下一批建议执行 Track A3,而不是扩大 root skills:
- 对
FAIL和PASS_WITH_WARNING做原因聚类,不修参考项目代码; - 对每个 suite 抽取 1-2 个高价值 PASS 样例,评价输出结构、金融术语、数据质量标注和可复用设计;
- 将
skillsChoice60 个技能映射到 FinClaw cognition chain:宏观认知、行业认知、机构/产品认知、组合/风险认知、合规/投后认知。
12. Batch 4 / Track A3:原因聚类与认知链路映射
执行时间:2026-05-11
本批没有扩大到 root skills/ 982/1022 技能,也没有修参考项目代码。目标是把 A2 的 FAIL / PASS_WITH_WARNING 从结果数字进一步拆成可解释原因,并识别各 suite 对 FinClaw cognition chain 的参考价值。
原因聚类:
| 原因聚类 | 数量 | 判断 |
|---|---|---|
| 完成但数据源降级 / 示例数据 / 结构化错误 | 31 | 仍有参考价值,核心在于是否透明表达数据质量和 fallback。 |
| 完成且输出稳定 | 19 | 可进入高价值样例池。 |
| 超时 / 长等待路径 | 7 | 暴露外部数据路径和内部超时控制不足。 |
| A1 入口阻塞 | 1 | 入口层代码缺陷。 |
| 代码缺陷 / 缺失 import 或未定义名称 | 1 | 实际路径缺少回归。 |
| 文件权限 / 运行目录问题 | 1 | 容器运行目录和 data/cache 权限需要隔离设计。 |
高价值样例:
bank-suite/bank-interbank-market:宏观 / 流动性认知。fund-suite/fund-screener:产品筛选认知。futures-suite/futures-arbitrage-analyzer:策略结构候选认知。insurance-suite/insurance-solvency-analyzer:监管框架认知。securities-suite/securities-policy-analyzer:政策认知。trust-suite/trust-income-calculator:确定性金融计算。trust-suite/trust-compliance-checker:合规认知与数据降级。trust-suite/trust-valuation-engine:估值认知与数据质量标注。
FinClaw cognition chain 映射:
| 认知链路 | 参考价值 |
|---|---|
| 宏观 / 流动性 / 政策认知 | 可吸收为宏观状态、政策事件、跨市场流动性输入,但需统一证据时间戳和数据质量。 |
| 行业 / 板块认知 | 适合作为行业扫描模板,需避免把静态框架伪装成实时结论。 |
| 机构 / 公司认知 | 适合作为经营与风险画像输入,需补强财报、行情和口径一致性。 |
| 产品 / 工具认知 | fund/trust 的 mock 和纯计算路径较接近可复用工具层。 |
| 组合 / 配置 / 风险认知 | 对 pre-execution checkpoint 有参考价值,但输出必须保持 cognition 而非自动执行。 |
| 合规 / 投后 / 运营认知 | 对金融机构工作流参考价值高,适合沉淀为后续团队版能力库候选。 |
原始产物:
packets/sync/finclaw-reference-experience-2026-05-09/logs/aifinlab-20260511-skillschoice-smoke-run/aifinlab-skillschoice-track-a3-clustering.md
13. Batch 4 结论
aifinlab/FinClaw 的 selected skills 层最值得吸收的不是单个脚本,而是“金融机构技能 taxonomy + 可执行工具入口 + 数据质量 / 降级显式化”的组合。短期不建议直接进入 root 982/1022 skills 全量执行;下一批应先完成 skillsChoice 60 技能的正式 taxonomy 与 FinClaw MVP 吸收 / 不吸收矩阵,再决定 root skills 的抽样策略。
14. Batch 5 / Track A4:精选技能分类与吸收矩阵
执行时间:2026-05-11
本批仍限定在 skillsChoice 60 个精选技能,不扩大到 root skills/ 982/1022 技能,不修参考项目代码。
本批产出:
packets/sync/finclaw-reference-experience-2026-05-09/logs/aifinlab-20260511-skillschoice-smoke-run/aifinlab-skillschoice-taxonomy-absorption-matrix.md
吸收判断汇总:
| 吸收判断 | 数量 | 说明 |
|---|---|---|
| 重设计后可吸收 | 29 | 能力方向、输入输出或分类有价值,但实现、数据质量、术语或边界需要重设计。 |
| 仅作模式参考 | 20 | 执行能完成但存在 warning / degraded / error 信息,主要吸收 fallback 与 data-quality 表达方式。 |
| 仅作覆盖参考 | 9 | 覆盖面有参考价值,但当前执行质量不足,不进入 MVP 高价值吸收池。 |
| 可作为工具样式参考 | 1 | 确定性工具或输出结构较清晰,可作为 FinClaw 工具样式参考,但仍需按上位产品模型重写。 |
| 暂不吸收 | 1 | 入口或核心路径阻塞,暂不作为 MVP 吸收对象。 |
套件层观察:
trust-suite的吸收质量最高:合规、估值、投后、收益计算和数据源降级模式参考价值突出。fund-suite的 mock / JSON 路径较成熟,适合作为产品筛选、组合、风险工具样式参考。futures-suite覆盖跨市场、套利、保证金、交割和风险,但需要明确数据源超时和策略候选边界。securities-suite与insurance-suite覆盖面强,但 A2 中超时较多,更适合作为分类覆盖和输出结构参考。bank-suite多数路径可完成,但数据源降级、N/A 和静态框架混合较多,需要重写证据口径。
15. Batch 5 结论
skillsChoice 60 个精选技能已经可以被视为一个稳定的参考分类样本。对 FinClaw MVP 来说,当前最重要的不是复用这些脚本,而是把它们沉淀成:
- 金融认知链路分类;
- 技能候选白名单 / 观察名单 / 排除名单;
- 每类技能的输入对象、输出对象、证据字段和数据质量字段;
- “认知输出”和“执行建议 / 操作动作”之间的边界说明。
下一批建议进入 Track A5:形成 FinClaw MVP 技能候选白名单 / 观察名单 / 排除名单,并明确每个候选进入 MVP 的产品对象、证据字段和用户认知场景。
16. Batch 6 / Track A5:MVP 技能候选名单
执行时间:2026-05-11
本批仍限定在 skillsChoice 60 个精选技能,不扩大到 root skills/ 982/1022 技能,不修参考项目代码。
本批产出:
packets/sync/finclaw-reference-experience-2026-05-09/logs/aifinlab-20260511-skillschoice-smoke-run/aifinlab-skillschoice-mvp-candidate-lists.md
名单汇总:
| 名单 | 数量 | 用途 |
|---|---|---|
| 白名单 | 12 | 可进入 FinClaw MVP 技能候选讨论,但仍需按上位产品模型重写。 |
| 观察名单 | 38 | 分类、输出结构、数据降级或场景有价值,但暂不作为 MVP 首批候选。 |
| 排除名单 | 10 | 当前入口、执行路径或边界风险不足以进入 MVP 候选池。 |
白名单能力:
trust-suite/trust-income-calculator:确定性收益计算。trust-suite/trust-compliance-checker:信托合规检查。trust-suite/trust-valuation-engine:信托估值认知。fund-suite/fund-screener:基金候选筛选。fund-suite/fund-risk-analyzer:基金风险认知。fund-suite/fund-sip-planner:定投计划认知。securities-suite/securities-policy-analyzer:证券政策认知。futures-suite/futures-arbitrage-analyzer:期货套利候选目录。futures-suite/futures-macro-correlation:期货宏观相关性。insurance-suite/insurance-solvency-analyzer:保险偿付能力监管框架。bank-suite/bank-interbank-market:银行间市场流动性。bank-suite/bank-risk-analyzer:银行风险画像。
17. Batch 6 结论
FinClaw MVP 最值得优先吸收的是“确定性计算 + 数据质量可解释 + 合规 / 估值 / 风险 / 政策认知”的组合。aifinlab 的参考价值已经从“项目体验”转化为一批可供产品定义和工程对齐使用的候选能力表。
下一批建议 Track A6:把白名单能力翻译成 FinClaw MVP 产品对象草案,包括 Market Cognition Snapshot、Market Cognition Thread、Evidence Item、Data Quality Note、Pre-Execution Checkpoint 的字段候选。
18. Batch 7 / Track A6:MVP 产品对象草案
执行时间:2026-05-11
本批仍限定在 A5 白名单中的 12 个 skillsChoice 能力,不扩大到 root skills/ 982/1022 技能,不修参考项目代码。
重要边界:本批产物是产品对象草案,不是工程接口契约、数据库 schema 或系统对接设计。
本批产出:
packets/sync/finclaw-reference-experience-2026-05-09/logs/aifinlab-20260511-skillschoice-smoke-run/aifinlab-skillschoice-mvp-product-object-draft.md
产品对象候选:
| 产品对象 | 用途 |
|---|---|
| Market Cognition Snapshot | 单次认知快照,描述某一市场、机构、产品、政策或风险对象在特定时间点的证据化状态。 |
| Market Cognition Thread | 围绕问题、主题或候选池的连续认知过程,容纳追问、证据补充和结论修订。 |
| Evidence Item | 可追溯证据,记录来源、时间、口径、数据质量和与结论的关系。 |
| Data Quality Note | 描述数据是否实时、模拟、降级、N/A 或需要人工复核。 |
| Pre-Execution Checkpoint | 承接计算、风险、合规、适配和边界提示,但不自动执行交易或配置动作。 |
第一优先级字段:
- 认知对象:
snapshot_subject/thread_subject/checkpoint_subject。 - 时间锚点:
time_anchor/observed_at/data_timestamp。 - 用户可理解结论:
key_findings/calculation_summary/candidate_items。 - 证据来源:
evidence_items。 - 数据质量:
data_quality_notes。 - 不自动执行边界:
non_execution_boundary。
19. Batch 7 结论
白名单能力可以收敛为五类 MVP 产品对象:快照、线程、证据、数据质量说明、执行前认知检查点。aifinlab 参考项目对 FinClaw 的最大贡献,是把金融能力拆成可认知、可证据化、可降级解释的能力单元,而不是提供可直接复用的实现。
下一批建议 Track A7:基于这些产品对象草案,整理一版团队认知对齐材料,用于参与者在各自个人域同步评估 aifinlab 参考价值。
20. Batch 8 / Track A7:团队认知对齐材料
执行时间:2026-05-11
本批目标是把 A1-A6 的技能层评测结果压缩为团队可同步的认知对齐材料,供参与 FinClaw 协同推进的团队成员及各自个人域 Agent 复核,而不是继续扩大测试范围。
本批仍不读取或运行 root skills/ 982/1022,不修参考项目代码,不生成工程接口契约。
本批产出:
projects/finclaw/reference-experience/aifinlab-team-alignment-brief.md
团队对齐口径:
| 事项 | 对齐结论 |
|---|---|
| 项目类别 | OpenClaw 金融技能层参考项目,不是单纯金融聊天助手。 |
| 主要资产 | skillsChoice 60 个精选技能、六大金融套件、root skills/ 982/1022 技能生态。 |
| 当前已评测范围 | 仅评测 skillsChoice 60 个精选技能;尚未扩大到 root skills。 |
| 执行方式 | Docker/OpenClaw 容器体验 + Python 脚本入口 smoke + minimal sample。 |
| 吸收方式 | 吸收分类、认知链路、输入输出对象、证据字段、数据质量表达;不直接吸收脚本实现。 |
| 产品边界 | 所有配置、组合、套利、估值、收益计算类能力都必须保持在 cognition / pre-execution checkpoint,不进入自动执行。 |
建议后续参与者优先复核的问题:
- 是否认可五类产品对象作为 FinClaw MVP 的认知对象候选?
- 12 个白名单能力中,哪些应进入 MVP 首批,哪些应延后?
- 对 Data Quality Note 是否需要更严格字段,例如数据时效、覆盖率、可靠性、fallback level?
- 对 Pre-Execution Checkpoint 的非执行边界是否足够清晰?
- root
skills/下一步应按哪些类别抽样,而不是全量运行?
21. Batch 8 结论
aifinlab/FinClaw 的团队同步价值已经从“能否运行”转为“如何作为技能层参考被一致理解”。当前最适合作为团队共享结论的是:它提供了金融机构技能 taxonomy、工具入口样式、数据质量显式化和 MVP 认知对象拆分样本;它不应被直接理解为 FinClaw MVP 的实现蓝本。
下一批建议 Track A8:准备一份个人域复核任务清单,使后续参与者可以按相同口径复核 aifinlab 参考项目,而不需要重复消耗完整上下文或重新跑全部测试。
22. Batch 9 / Track A8:个人域复核任务清单
执行时间:2026-05-11
本批目标是把 A1-A7 的评测结果转化为可分发、可复核、可汇总的个人域任务清单。它不是新增评测结论,也不要求后续参与者重新跑完 skillsChoice 60 个技能。
本批产出:
projects/finclaw/reference-experience/aifinlab-personal-domain-review-checklist.md
复核清单要求后续参与者重点回答:
| 编号 | 复核问题 |
|---|---|
| RQ-01 | 是否认可 aifinlab 的主要参考价值在“金融机构技能 taxonomy + 工具入口 + 数据质量显式化 + 认知对象拆分”? |
| RQ-02 | 五类产品对象是否足以承接当前白名单能力? |
| RQ-03 | 12 个白名单能力中,哪些应进入 MVP 首批讨论? |
| RQ-04 | 哪些能力容易被误解为自动执行或投资指令? |
| RQ-05 | Data Quality Note 是否需要补充字段? |
| RQ-06 | root skills/ 下一步是否值得抽样? |
23. Batch 9 结论
Track A8 已把 aifinlab 技能层评测沉淀为个人域复核任务清单。后续不需要把当前团队成员状态写死进文档;参与者可以动态变化,但复核口径保持一致。
下一批建议:等待个人域复核反馈,或进入 root skills/ 小批量抽样方案设计。若进入抽样,应继续坚持“小批次、按类别、先目录画像后抽样、不全量读取”的方式。