FinClaw First-Batch Reference Cross Analysis
状态:Current Cross-Reference Analysis 日期:2026-05-11 角色:FinClaw Program Controller
1. Scope
本文基于第一批四个第三方参考项目的正式体验评测,形成横向对比、吸收判断和 FinClaw 方案设计建议。
本报告使用的正式输入:
projects/finclaw/reference-experience/martinpmm-finclaw-evaluation.mdprojects/finclaw/reference-experience/fin-chelae-finclaw-evaluation.mdprojects/finclaw/reference-experience/aifinlab-finclaw-evaluation.mdprojects/finclaw/reference-experience/aifinlab-skill-layer-evaluation.mdprojects/finclaw/reference-experience/finrobot-evaluation.mdprojects/finclaw/strategic-whitepaper.mdprojects/finclaw/product-definition.mdprojects/finclaw/mvp-product-definition.mdevaluation/finclaw/case-library.md
本文不是工程接口契约,不定义系统对接设计,不反向覆盖 FinClaw 上位产品定义。
2. Executive Conclusion
第一批四个参考项目已经覆盖了 FinClaw 体系的四类关键参考面:
| Reference Type | Project | What It Proves | Main Limit |
|---|---|---|---|
| 持续个人金融认知 Agent | martinpmm-Finclaw | 真实 chat、watchlist、thesis、持续跟踪、proactive loop 对个人认知产品有价值。 | 来源、时间戳、工具失败披露和 eager side effect 风险。 |
| 画像 / 渠道 / 工具型金融 Agent | Fin-Chelae-FinClaw | 完成投资画像后,个性化、策略视角、渠道和工具组织能明显提升体验。 | onboarding 体验弱,画像话术偶发重复,监控状态真实性需约束。 |
| 金融技能生态 / 原子能力库 | aifinlab-FinClaw | 金融机构 taxonomy、60 个精选 skills、数据降级表达、OpenClaw 生态组织方式有高参考价值。 | 大量技能不能直接吸收;实时数据、来源和执行质量不稳定。 |
| 报告生产流水线 | FinRobot | 数据获取、预测表、敏感性分析、图表和 HTML report 生成是成熟的 report-pipeline 参考。 | 不是 chat cognition;外部数据权限和 LLM narrative 稳定性强影响报告质量。 |
核心判断:
- FinClaw 不应被做成单一 chat bot、单一 report generator、横向 SkillHub,也不应做成执行前插件。
- FinClaw 应吸收四类参考面的组合:真实个人认知体验、画像与记忆、可治理 FinSkills、证据化报告 / 快照生产。
- FinClaw 第一阶段最应该验证的是“个人金融认知闭环”:用户问题 -> 结构化认知快照 -> 认知线程 -> 证据 / 数据质量 -> 后续观察计划 -> 人可复查更新。
- FinClaw 的策略、提醒、组合、风险、target price、情景路径等都可以进入认知边界,但必须表达为证据有界、条件化、可复查的认知产物,不进入真实执行。
3. Cross-Project Comparison
3.1 Product Shape
| Dimension | martinpmm | Chelae | aifinlab | FinRobot | FinClaw Implication |
|---|---|---|---|---|---|
| Primary shape | 个人金融助手 | 多渠道 / 画像型 Agent | OpenClaw 金融技能生态 | Equity report pipeline | FinClaw 应是认知产品,不是单点形态。 |
| Best interaction | 自然 chat + watchlist | profile-aware chat | skill-loaded chat / skill execution | CLI report run + HTML review | MVP 入口可以是 chat,但核心对象必须结构化。 |
| Personalization | watchlist / thesis 强 | onboarding 后明显增强 | 弱 | 基本无 | FinClaw 需要用户关注对象、画像、偏好和研究线程。 |
| Persistence | cron / heartbeat 表面强 | session / profile 强 | 弱 | artifact persistence 强 | FinClaw persistence 应优先是认知线程,不是默认执行任务。 |
| Output form | 对话、监控、brief | 对话、计划、工具输出 | 技能输出、框架分析 | HTML report / charts / CSV | FinClaw 应支持 snapshot、thread、brief、report 四种输出层级。 |
3.2 Capability Comparison
| Capability | Strongest Reference | Cross-Project Finding | Absorption Direction |
|---|---|---|---|
| 真实口语问题理解 | martinpmm / Chelae | 两者都能处理短问、焦虑、追问和混合概念;aifinlab 偏框架化。 | MVP chat 不能只支持专业 prompt,必须支持真实用户语言。 |
| 投资画像 / 个性化 | Chelae | onboarding 后质量明显提升,但首次配置体验弱。 | FinClaw 需要轻量画像,但不能让画像流程频繁打断认知任务。 |
| Watchlist / thesis / thread | martinpmm | 最接近持续个人认知 Agent。 | 吸收为 Market Cognition Thread,而不是直接吸收 alert/action 行为。 |
| 金融技能 taxonomy | aifinlab | 60 个精选 skills 对机构 / 产品 / 风险 / 合规 / 投后有参考价值。 | 吸收分类、输入输出、数据质量表达;不直接吸收脚本实现。 |
| 报告生产 | FinRobot | 报告结构、图表、CSV/JSON 产物成熟。 | 吸收为 Cognition Snapshot Report / Thread Brief 输出,不把 FinClaw 收窄为报告生成器。 |
| 数据降级透明度 | aifinlab / FinRobot | 技能和报告都暴露数据源失败、N/A、402/403/401、fallback。 | Data Quality Note 必须是一等对象。 |
| 来源 / 时间戳 | 全部薄弱 | 四个项目共同弱项是 source provenance、timestamp、tool trace 和报告内证据披露。 | FinClaw 必须把 Evidence Item 作为核心对象,而不是事后注释。 |
| 执行边界 | martinpmm / Chelae 暴露风险 | soft ask 下创建任务、监控声明、action-state truthfulness 都需要治理。 | FinClaw 输出 Pre-Execution Checkpoint,不默认执行。 |
3.3 Evaluation Result Pattern
| Project | Strong Areas | Weak Areas | Cross-Analysis Label |
|---|---|---|---|
| martinpmm | watchlist、真实 chat、策略视角、长期跟踪、proactive loop | provenance、时间戳、工具失败披露、eager side effect | Personal cognition thread reference |
| Chelae | onboarding 后画像、crypto fundamentals、策略 lens、due diligence、long thesis | 首次配置、重复画像、source/timestamp、monitoring truthfulness | Profile-aware agent reference |
| aifinlab | skill taxonomy、OpenClaw 组织、A 股/机构覆盖、selected skills smoke | discovery truncation、实时数据弱、工具失败降级弱、token 成本高 | FinSkills ecosystem reference |
| FinRobot | data pipeline、report rendering、charts、sensitivity、artifact persistence | news/rating/sentiment 权限、LLM narrative、报告内 provenance | Report-pipeline reference |
4. What FinClaw Should Absorb
4.1 Product-Level Absorption
FinClaw 应吸收以下产品模式:
- 真实用户语言入口:支持口语、短问、焦虑、追问、混合概念和专业研究式问题。
- 持续认知线程:每个资产、主题、事件或用户问题都能形成可追踪 thread。
- 画像增强:用户关注市场、风险偏好、知识水平和研究风格应影响输出,但不能打断核心任务。
- 报告化输出:复杂认知结果应可转为 browser-readable report、team brief 或 snapshot artifact。
- 数据质量显式化:实时、延迟、模拟、N/A、fallback、权限受限和工具失败必须可见。
- 执行前认知检查点:策略建议、提醒、组合风险和行动语言必须收束为条件化认知与确认清单。
4.2 Capability-Level Absorption
FinClaw 第一阶段能力可组织为五类:
| Capability Layer | Meaning | Main Reference |
|---|---|---|
| Market Cognition Snapshot | 某一资产、主题、事件或叙事在时间点上的结构化认知快照。 | FinRobot report structure + martinpmm analysis flow |
| Market Cognition Thread | 围绕同一对象持续更新的认知过程。 | martinpmm watchlist / thesis / heartbeat |
| Evidence Layer | 来源、时间、口径、数据质量、推断边界。 | all projects' common weakness |
| FinSkills Layer | 可复用金融认知原子能力。 | aifinlab selected skills taxonomy |
| Pre-Execution Checkpoint | 策略、风险、配置和提醒的执行前认知检查。 | martinpmm / Chelae action risk + aifinlab risk tools |
4.3 Evaluation-Level Absorption
当前 evaluation/finclaw/case-library.md 应继续作为 FinClaw 体系评测基线,并新增三个方向的后续结构化落地:
cases/:把Cognition-Matrix-*、Real-Chat-*、Report-Pipeline-*抽为 YAML。runs/:把四个项目的正式评测结果转为结构化 run result。reports/:持续产出横向对比、吸收矩阵和产品方案建议。
5. What FinClaw Should Not Absorb Directly
| Do Not Absorb | Reason | Safer Translation |
|---|---|---|
| 默认创建 cron / heartbeat / alert | 容易在 soft ask 下产生持久化副作用。 | 先生成 Pre-Execution Checkpoint,再由用户确认是否进入任务系统。 |
| meme launch / wallet / token launch | 属于高风险执行或发行链路。 | 仅作为外部参考和风险识别 case,不进入 MVP。 |
| 全量横向 SkillHub | 容易把 FinClaw 拉成泛金融技能仓库。 | 只吸收与认知对象直接相关的 FinSkills。 |
| 报告生成器定位 | 会把 FinClaw 收窄为 artifact pipeline。 | 报告是 snapshot/thread 的输出形式之一。 |
| 无 provenance 的强结论 | 四个参考项目共同弱项。 | 每个结论必须绑定证据、时间和数据质量说明。 |
| “已执行”式话术 | 参考项目多次出现 action-state truthfulness 风险。 | 区分 proposed / confirmed / executed / unavailable。 |
6. FinClaw Scheme Design Recommendation
6.1 Positioning
建议继续使用当前上位定义:
FinClaw 是 FinTec AI Ecosystem 中的独立金融认知产品 / 系统,位于金融信息感知和交易执行之间。
对外当前不建议直接使用 Financial Cognition Operating System 做第一阶段产品承诺。它可以保留为战略完整态表达;MVP 应表达为:
面向个人用户的金融认知产品,帮助用户围绕加密资产、主题、事件和叙事形成可复查、可更新、可追踪的结构化市场认知。
6.2 First-Stage Product Shape
建议第一阶段产品形态是:
Chat entry
-> Market Cognition Snapshot
-> Market Cognition Thread
-> Evidence / Data Quality Layer
-> Brief / Report / Watch Questions
-> Pre-Execution Checkpoint
这意味着:
- Chat 是入口,不是产品本体。
- Report 是输出形态,不是产品本体。
- FinSkills 是能力单元,不是产品本体。
- Thread 是 MVP 最关键的持续价值对象。
6.3 MVP Objects
建议 MVP 收敛为六个对象:
| Object | Role |
|---|---|
| Market Cognition Snapshot | 单次结构化认知快照。 |
| Market Cognition Thread | 持续跟踪同一资产、主题、事件或 thesis。 |
| Evidence Item | 来源、时间、口径、证据类型和关联结论。 |
| Data Quality Note | 实时 / 延迟 / 模拟 / 降级 / 不可用 / 需复核。 |
Watch Question | 后续需要观察、验证或分工的问题。 |
| Pre-Execution Checkpoint | 进入执行系统前的风险、前提、边界和确认清单。 |
6.4 MVP Experience Flow
建议第一阶段优先验证以下用户闭环:
- 用户提出真实问题:例如“BTC 又抽风了,我是不是看错了?”
- FinClaw 识别对象、语境和用户情绪。
- 生成 Market Cognition Snapshot:事实、推断、风险、反方、未知项。
- 绑定 Evidence Item 和 Data Quality Note。
- 将快照加入 Market Cognition Thread。
- 生成后续
Watch Questions和复盘点。 - 若用户要求提醒、补仓、减仓、对冲或执行动作,只生成 Pre-Execution Checkpoint,不直接执行。
6.5 FinAgents / FinSkills Design Direction
建议把 FinAgents / FinSkills 的第一阶段职责压窄:
| Layer | First-Stage Role | Reference Lesson |
|---|---|---|
| FinSkills | 原子金融认知能力,如行情解释、事件拆解、证据抽取、风险映射、数据质量标注。 | 来自 aifinlab,但必须重写边界和证据字段。 |
| FinAgents | 围绕用户问题组合 FinSkills,生成 snapshot/thread/brief/checkpoint。 | 不做泛金融任务执行器。 |
| Orchestration | 根据问题类型选择 cognition path。 | 吸收 Chelae / martinpmm 的自然 chat 与画像,但加上 evidence guardrail。 |
| Report Renderer | 把 snapshot/thread 转为可读 artifact。 | 吸收 FinRobot 的报告结构和图表思路。 |
6.6 Priority Recommendation
建议后续推进优先级:
| Priority | Workstream | Reason |
|---|---|---|
| P0 | 结构化认知对象和 thread 体验 | 这是 FinClaw 区别于普通 chat 和 report generator 的核心。 |
| P0 | Evidence / Data Quality 标准 | 这是四个参考项目共同弱项,也是 FinClaw 的质量壁垒。 |
| P0 | 真实用户语言 case 回归 | martinpmm / Chelae 证明真实 chat 体验很关键。 |
| P1 | FinSkills MVP 白名单 | 从 aifinlab taxonomy 中筛出与 crypto cognition MVP 直接相关的技能。 |
| P1 | Report / Brief 输出 | 从 FinRobot 吸收报告形态,但不把它作为唯一主体验。 |
| P2 | Proactive loop / reminders | 有价值但副作用风险高,必须等待确认机制和状态真实性设计。 |
| P2 | 多市场 / 机构技能扩展 | 可作为完整态,不应抢占 crypto MVP 闭环。 |
7. Proposed Next Step
下一批建议不要继续新增参考项目,而是进入 “FinClaw Evaluation-to-Product Translation”:
- 从本文抽取
FinClaw MVP Absorption Matrix。 - 将四类参考能力映射到
mvp-product-definition.md的 P0 / P1 / P2。 - 为
evaluation/finclaw/cases/设计第一批结构化 case YAML。 - 准备后续工程协同输入包时,只引用已收敛对象,不把参考项目实现细节直接下推给工程。