FinClaw First-Batch Reference Cross Analysis

状态：Current Cross-Reference Analysis 日期：2026-05-11 角色：FinClaw Program Controller

1. Scope

本文基于第一批四个第三方参考项目的正式体验评测，形成横向对比、吸收判断和 FinClaw 方案设计建议。

本报告使用的正式输入：

projects/finclaw/reference-experience/martinpmm-finclaw-evaluation.md
projects/finclaw/reference-experience/fin-chelae-finclaw-evaluation.md
projects/finclaw/reference-experience/aifinlab-finclaw-evaluation.md
projects/finclaw/reference-experience/aifinlab-skill-layer-evaluation.md
projects/finclaw/reference-experience/finrobot-evaluation.md
projects/finclaw/strategic-whitepaper.md
projects/finclaw/product-definition.md
projects/finclaw/mvp-product-definition.md
evaluation/finclaw/case-library.md

本文不是工程接口契约，不定义系统对接设计，不反向覆盖 FinClaw 上位产品定义。

2. Executive Conclusion

第一批四个参考项目已经覆盖了 FinClaw 体系的四类关键参考面：

Reference Type	Project	What It Proves	Main Limit
持续个人金融认知 Agent	`martinpmm-Finclaw`	真实 chat、watchlist、thesis、持续跟踪、proactive loop 对个人认知产品有价值。	来源、时间戳、工具失败披露和 eager side effect 风险。
画像 / 渠道 / 工具型金融 Agent	`Fin-Chelae-FinClaw`	完成投资画像后，个性化、策略视角、渠道和工具组织能明显提升体验。	onboarding 体验弱，画像话术偶发重复，监控状态真实性需约束。
金融技能生态 / 原子能力库	`aifinlab-FinClaw`	金融机构 taxonomy、60 个精选 skills、数据降级表达、OpenClaw 生态组织方式有高参考价值。	大量技能不能直接吸收；实时数据、来源和执行质量不稳定。
报告生产流水线	`FinRobot`	数据获取、预测表、敏感性分析、图表和 HTML report 生成是成熟的 report-pipeline 参考。	不是 chat cognition；外部数据权限和 LLM narrative 稳定性强影响报告质量。

核心判断：

FinClaw 不应被做成单一 chat bot、单一 report generator、横向 SkillHub，也不应做成执行前插件。
FinClaw 应吸收四类参考面的组合：真实个人认知体验、画像与记忆、可治理 FinSkills、证据化报告 / 快照生产。
FinClaw 第一阶段最应该验证的是“个人金融认知闭环”：用户问题 -> 结构化认知快照 -> 认知线程 -> 证据 / 数据质量 -> 后续观察计划 -> 人可复查更新。
FinClaw 的策略、提醒、组合、风险、target price、情景路径等都可以进入认知边界，但必须表达为证据有界、条件化、可复查的认知产物，不进入真实执行。

3. Cross-Project Comparison

3.1 Product Shape

Dimension	martinpmm	Chelae	aifinlab	FinRobot	FinClaw Implication
Primary shape	个人金融助手	多渠道 / 画像型 Agent	OpenClaw 金融技能生态	Equity report pipeline	FinClaw 应是认知产品，不是单点形态。
Best interaction	自然 chat + watchlist	profile-aware chat	skill-loaded chat / skill execution	CLI report run + HTML review	MVP 入口可以是 chat，但核心对象必须结构化。
Personalization	watchlist / thesis 强	onboarding 后明显增强	弱	基本无	FinClaw 需要用户关注对象、画像、偏好和研究线程。
Persistence	cron / heartbeat 表面强	session / profile 强	弱	artifact persistence 强	FinClaw persistence 应优先是认知线程，不是默认执行任务。
Output form	对话、监控、brief	对话、计划、工具输出	技能输出、框架分析	HTML report / charts / CSV	FinClaw 应支持 snapshot、thread、brief、report 四种输出层级。

3.2 Capability Comparison

Capability	Strongest Reference	Cross-Project Finding	Absorption Direction
真实口语问题理解	martinpmm / Chelae	两者都能处理短问、焦虑、追问和混合概念；aifinlab 偏框架化。	MVP chat 不能只支持专业 prompt，必须支持真实用户语言。
投资画像 / 个性化	Chelae	onboarding 后质量明显提升，但首次配置体验弱。	FinClaw 需要轻量画像，但不能让画像流程频繁打断认知任务。
Watchlist / thesis / thread	martinpmm	最接近持续个人认知 Agent。	吸收为 Market Cognition Thread，而不是直接吸收 alert/action 行为。
金融技能 taxonomy	aifinlab	60 个精选 skills 对机构 / 产品 / 风险 / 合规 / 投后有参考价值。	吸收分类、输入输出、数据质量表达；不直接吸收脚本实现。
报告生产	FinRobot	报告结构、图表、CSV/JSON 产物成熟。	吸收为 Cognition Snapshot Report / Thread Brief 输出，不把 FinClaw 收窄为报告生成器。
数据降级透明度	aifinlab / FinRobot	技能和报告都暴露数据源失败、N/A、402/403/401、fallback。	Data Quality Note 必须是一等对象。
来源 / 时间戳	全部薄弱	四个项目共同弱项是 source provenance、timestamp、tool trace 和报告内证据披露。	FinClaw 必须把 Evidence Item 作为核心对象，而不是事后注释。
执行边界	martinpmm / Chelae 暴露风险	soft ask 下创建任务、监控声明、action-state truthfulness 都需要治理。	FinClaw 输出 Pre-Execution Checkpoint，不默认执行。

3.3 Evaluation Result Pattern

Project	Strong Areas	Weak Areas	Cross-Analysis Label
martinpmm	watchlist、真实 chat、策略视角、长期跟踪、proactive loop	provenance、时间戳、工具失败披露、eager side effect	Personal cognition thread reference
Chelae	onboarding 后画像、crypto fundamentals、策略 lens、due diligence、long thesis	首次配置、重复画像、source/timestamp、monitoring truthfulness	Profile-aware agent reference
aifinlab	skill taxonomy、OpenClaw 组织、A 股/机构覆盖、selected skills smoke	discovery truncation、实时数据弱、工具失败降级弱、token 成本高	FinSkills ecosystem reference
FinRobot	data pipeline、report rendering、charts、sensitivity、artifact persistence	news/rating/sentiment 权限、LLM narrative、报告内 provenance	Report-pipeline reference

4. What FinClaw Should Absorb

4.1 Product-Level Absorption

FinClaw 应吸收以下产品模式：

真实用户语言入口：支持口语、短问、焦虑、追问、混合概念和专业研究式问题。
持续认知线程：每个资产、主题、事件或用户问题都能形成可追踪 thread。
画像增强：用户关注市场、风险偏好、知识水平和研究风格应影响输出，但不能打断核心任务。
报告化输出：复杂认知结果应可转为 browser-readable report、team brief 或 snapshot artifact。
数据质量显式化：实时、延迟、模拟、N/A、fallback、权限受限和工具失败必须可见。
执行前认知检查点：策略建议、提醒、组合风险和行动语言必须收束为条件化认知与确认清单。

4.2 Capability-Level Absorption

FinClaw 第一阶段能力可组织为五类：

Capability Layer	Meaning	Main Reference
Market Cognition Snapshot	某一资产、主题、事件或叙事在时间点上的结构化认知快照。	FinRobot report structure + martinpmm analysis flow
Market Cognition Thread	围绕同一对象持续更新的认知过程。	martinpmm watchlist / thesis / heartbeat
Evidence Layer	来源、时间、口径、数据质量、推断边界。	all projects' common weakness
FinSkills Layer	可复用金融认知原子能力。	aifinlab selected skills taxonomy
Pre-Execution Checkpoint	策略、风险、配置和提醒的执行前认知检查。	martinpmm / Chelae action risk + aifinlab risk tools

4.3 Evaluation-Level Absorption

当前 evaluation/finclaw/case-library.md 应继续作为 FinClaw 体系评测基线，并新增三个方向的后续结构化落地：

cases/：把 Cognition-Matrix-*、Real-Chat-*、Report-Pipeline-* 抽为 YAML。
runs/：把四个项目的正式评测结果转为结构化 run result。
reports/：持续产出横向对比、吸收矩阵和产品方案建议。

5. What FinClaw Should Not Absorb Directly

Do Not Absorb	Reason	Safer Translation
默认创建 cron / heartbeat / alert	容易在 soft ask 下产生持久化副作用。	先生成 Pre-Execution Checkpoint，再由用户确认是否进入任务系统。
meme launch / wallet / token launch	属于高风险执行或发行链路。	仅作为外部参考和风险识别 case，不进入 MVP。
全量横向 SkillHub	容易把 FinClaw 拉成泛金融技能仓库。	只吸收与认知对象直接相关的 FinSkills。
报告生成器定位	会把 FinClaw 收窄为 artifact pipeline。	报告是 snapshot/thread 的输出形式之一。
无 provenance 的强结论	四个参考项目共同弱项。	每个结论必须绑定证据、时间和数据质量说明。
“已执行”式话术	参考项目多次出现 action-state truthfulness 风险。	区分 proposed / confirmed / executed / unavailable。

6. FinClaw Scheme Design Recommendation

6.1 Positioning

建议继续使用当前上位定义：

FinClaw 是 FinTec AI Ecosystem 中的独立金融认知产品 / 系统，位于金融信息感知和交易执行之间。

对外当前不建议直接使用 Financial Cognition Operating System 做第一阶段产品承诺。它可以保留为战略完整态表达；MVP 应表达为：

面向个人用户的金融认知产品，帮助用户围绕加密资产、主题、事件和叙事形成可复查、可更新、可追踪的结构化市场认知。

6.2 First-Stage Product Shape

建议第一阶段产品形态是：

Chat entry
  -> Market Cognition Snapshot
  -> Market Cognition Thread
  -> Evidence / Data Quality Layer
  -> Brief / Report / Watch Questions
  -> Pre-Execution Checkpoint

这意味着：

Chat 是入口，不是产品本体。
Report 是输出形态，不是产品本体。
FinSkills 是能力单元，不是产品本体。
Thread 是 MVP 最关键的持续价值对象。

6.3 MVP Objects

建议 MVP 收敛为六个对象：

Object	Role
Market Cognition Snapshot	单次结构化认知快照。
Market Cognition Thread	持续跟踪同一资产、主题、事件或 thesis。
Evidence Item	来源、时间、口径、证据类型和关联结论。
Data Quality Note	实时 / 延迟 / 模拟 / 降级 / 不可用 / 需复核。
`Watch Question`	后续需要观察、验证或分工的问题。
Pre-Execution Checkpoint	进入执行系统前的风险、前提、边界和确认清单。

6.4 MVP Experience Flow

建议第一阶段优先验证以下用户闭环：

用户提出真实问题：例如“BTC 又抽风了，我是不是看错了？”
FinClaw 识别对象、语境和用户情绪。
生成 Market Cognition Snapshot：事实、推断、风险、反方、未知项。
绑定 Evidence Item 和 Data Quality Note。
将快照加入 Market Cognition Thread。
生成后续 Watch Questions 和复盘点。
若用户要求提醒、补仓、减仓、对冲或执行动作，只生成 Pre-Execution Checkpoint，不直接执行。

6.5 FinAgents / FinSkills Design Direction

建议把 FinAgents / FinSkills 的第一阶段职责压窄：

Layer	First-Stage Role	Reference Lesson
FinSkills	原子金融认知能力，如行情解释、事件拆解、证据抽取、风险映射、数据质量标注。	来自 aifinlab，但必须重写边界和证据字段。
FinAgents	围绕用户问题组合 FinSkills，生成 snapshot/thread/brief/checkpoint。	不做泛金融任务执行器。
Orchestration	根据问题类型选择 cognition path。	吸收 Chelae / martinpmm 的自然 chat 与画像，但加上 evidence guardrail。
Report Renderer	把 snapshot/thread 转为可读 artifact。	吸收 FinRobot 的报告结构和图表思路。

6.6 Priority Recommendation

建议后续推进优先级：

Priority	Workstream	Reason
P0	结构化认知对象和 thread 体验	这是 FinClaw 区别于普通 chat 和 report generator 的核心。
P0	Evidence / Data Quality 标准	这是四个参考项目共同弱项，也是 FinClaw 的质量壁垒。
P0	真实用户语言 case 回归	martinpmm / Chelae 证明真实 chat 体验很关键。
P1	FinSkills MVP 白名单	从 aifinlab taxonomy 中筛出与 crypto cognition MVP 直接相关的技能。
P1	Report / Brief 输出	从 FinRobot 吸收报告形态，但不把它作为唯一主体验。
P2	Proactive loop / reminders	有价值但副作用风险高，必须等待确认机制和状态真实性设计。
P2	多市场 / 机构技能扩展	可作为完整态，不应抢占 crypto MVP 闭环。

7. Proposed Next Step

下一批建议不要继续新增参考项目，而是进入 “FinClaw Evaluation-to-Product Translation”：

从本文抽取 FinClaw MVP Absorption Matrix。
将四类参考能力映射到 mvp-product-definition.md 的 P0 / P1 / P2。
为 evaluation/finclaw/cases/ 设计第一批结构化 case YAML。
准备后续工程协同输入包时，只引用已收敛对象，不把参考项目实现细节直接下推给工程。

1. Scope​

2. Executive Conclusion​

3. Cross-Project Comparison​

3.1 Product Shape​

3.2 Capability Comparison​

3.3 Evaluation Result Pattern​

4. What FinClaw Should Absorb​

4.1 Product-Level Absorption​

4.2 Capability-Level Absorption​

4.3 Evaluation-Level Absorption​

5. What FinClaw Should Not Absorb Directly​

6. FinClaw Scheme Design Recommendation​

6.1 Positioning​

6.2 First-Stage Product Shape​

6.3 MVP Objects​

6.4 MVP Experience Flow​

6.5 FinAgents / FinSkills Design Direction​

6.6 Priority Recommendation​

7. Proposed Next Step​