跳到主要内容

FinClaw First-Batch Reference Cross Analysis

状态:Current Cross-Reference Analysis 日期:2026-05-11 角色:FinClaw Program Controller

1. Scope

本文基于第一批四个第三方参考项目的正式体验评测,形成横向对比、吸收判断和 FinClaw 方案设计建议。

本报告使用的正式输入:

  • projects/finclaw/reference-experience/martinpmm-finclaw-evaluation.md
  • projects/finclaw/reference-experience/fin-chelae-finclaw-evaluation.md
  • projects/finclaw/reference-experience/aifinlab-finclaw-evaluation.md
  • projects/finclaw/reference-experience/aifinlab-skill-layer-evaluation.md
  • projects/finclaw/reference-experience/finrobot-evaluation.md
  • projects/finclaw/strategic-whitepaper.md
  • projects/finclaw/product-definition.md
  • projects/finclaw/mvp-product-definition.md
  • evaluation/finclaw/case-library.md

本文不是工程接口契约,不定义系统对接设计,不反向覆盖 FinClaw 上位产品定义。

2. Executive Conclusion

第一批四个参考项目已经覆盖了 FinClaw 体系的四类关键参考面:

Reference TypeProjectWhat It ProvesMain Limit
持续个人金融认知 Agentmartinpmm-Finclaw真实 chat、watchlist、thesis、持续跟踪、proactive loop 对个人认知产品有价值。来源、时间戳、工具失败披露和 eager side effect 风险。
画像 / 渠道 / 工具型金融 AgentFin-Chelae-FinClaw完成投资画像后,个性化、策略视角、渠道和工具组织能明显提升体验。onboarding 体验弱,画像话术偶发重复,监控状态真实性需约束。
金融技能生态 / 原子能力库aifinlab-FinClaw金融机构 taxonomy、60 个精选 skills、数据降级表达、OpenClaw 生态组织方式有高参考价值。大量技能不能直接吸收;实时数据、来源和执行质量不稳定。
报告生产流水线FinRobot数据获取、预测表、敏感性分析、图表和 HTML report 生成是成熟的 report-pipeline 参考。不是 chat cognition;外部数据权限和 LLM narrative 稳定性强影响报告质量。

核心判断:

  1. FinClaw 不应被做成单一 chat bot、单一 report generator、横向 SkillHub,也不应做成执行前插件。
  2. FinClaw 应吸收四类参考面的组合:真实个人认知体验、画像与记忆、可治理 FinSkills、证据化报告 / 快照生产。
  3. FinClaw 第一阶段最应该验证的是“个人金融认知闭环”:用户问题 -> 结构化认知快照 -> 认知线程 -> 证据 / 数据质量 -> 后续观察计划 -> 人可复查更新。
  4. FinClaw 的策略、提醒、组合、风险、target price、情景路径等都可以进入认知边界,但必须表达为证据有界、条件化、可复查的认知产物,不进入真实执行。

3. Cross-Project Comparison

3.1 Product Shape

DimensionmartinpmmChelaeaifinlabFinRobotFinClaw Implication
Primary shape个人金融助手多渠道 / 画像型 AgentOpenClaw 金融技能生态Equity report pipelineFinClaw 应是认知产品,不是单点形态。
Best interaction自然 chat + watchlistprofile-aware chatskill-loaded chat / skill executionCLI report run + HTML reviewMVP 入口可以是 chat,但核心对象必须结构化。
Personalizationwatchlist / thesis 强onboarding 后明显增强基本无FinClaw 需要用户关注对象、画像、偏好和研究线程。
Persistencecron / heartbeat 表面强session / profile 强artifact persistence 强FinClaw persistence 应优先是认知线程,不是默认执行任务。
Output form对话、监控、brief对话、计划、工具输出技能输出、框架分析HTML report / charts / CSVFinClaw 应支持 snapshot、thread、brief、report 四种输出层级。

3.2 Capability Comparison

CapabilityStrongest ReferenceCross-Project FindingAbsorption Direction
真实口语问题理解martinpmm / Chelae两者都能处理短问、焦虑、追问和混合概念;aifinlab 偏框架化。MVP chat 不能只支持专业 prompt,必须支持真实用户语言。
投资画像 / 个性化Chelaeonboarding 后质量明显提升,但首次配置体验弱。FinClaw 需要轻量画像,但不能让画像流程频繁打断认知任务。
Watchlist / thesis / threadmartinpmm最接近持续个人认知 Agent。吸收为 Market Cognition Thread,而不是直接吸收 alert/action 行为。
金融技能 taxonomyaifinlab60 个精选 skills 对机构 / 产品 / 风险 / 合规 / 投后有参考价值。吸收分类、输入输出、数据质量表达;不直接吸收脚本实现。
报告生产FinRobot报告结构、图表、CSV/JSON 产物成熟。吸收为 Cognition Snapshot Report / Thread Brief 输出,不把 FinClaw 收窄为报告生成器。
数据降级透明度aifinlab / FinRobot技能和报告都暴露数据源失败、N/A、402/403/401、fallback。Data Quality Note 必须是一等对象。
来源 / 时间戳全部薄弱四个项目共同弱项是 source provenance、timestamp、tool trace 和报告内证据披露。FinClaw 必须把 Evidence Item 作为核心对象,而不是事后注释。
执行边界martinpmm / Chelae 暴露风险soft ask 下创建任务、监控声明、action-state truthfulness 都需要治理。FinClaw 输出 Pre-Execution Checkpoint,不默认执行。

3.3 Evaluation Result Pattern

ProjectStrong AreasWeak AreasCross-Analysis Label
martinpmmwatchlist、真实 chat、策略视角、长期跟踪、proactive loopprovenance、时间戳、工具失败披露、eager side effectPersonal cognition thread reference
Chelaeonboarding 后画像、crypto fundamentals、策略 lens、due diligence、long thesis首次配置、重复画像、source/timestamp、monitoring truthfulnessProfile-aware agent reference
aifinlabskill taxonomy、OpenClaw 组织、A 股/机构覆盖、selected skills smokediscovery truncation、实时数据弱、工具失败降级弱、token 成本高FinSkills ecosystem reference
FinRobotdata pipeline、report rendering、charts、sensitivity、artifact persistencenews/rating/sentiment 权限、LLM narrative、报告内 provenanceReport-pipeline reference

4. What FinClaw Should Absorb

4.1 Product-Level Absorption

FinClaw 应吸收以下产品模式:

  1. 真实用户语言入口:支持口语、短问、焦虑、追问、混合概念和专业研究式问题。
  2. 持续认知线程:每个资产、主题、事件或用户问题都能形成可追踪 thread。
  3. 画像增强:用户关注市场、风险偏好、知识水平和研究风格应影响输出,但不能打断核心任务。
  4. 报告化输出:复杂认知结果应可转为 browser-readable report、team brief 或 snapshot artifact。
  5. 数据质量显式化:实时、延迟、模拟、N/A、fallback、权限受限和工具失败必须可见。
  6. 执行前认知检查点:策略建议、提醒、组合风险和行动语言必须收束为条件化认知与确认清单。

4.2 Capability-Level Absorption

FinClaw 第一阶段能力可组织为五类:

Capability LayerMeaningMain Reference
Market Cognition Snapshot某一资产、主题、事件或叙事在时间点上的结构化认知快照。FinRobot report structure + martinpmm analysis flow
Market Cognition Thread围绕同一对象持续更新的认知过程。martinpmm watchlist / thesis / heartbeat
Evidence Layer来源、时间、口径、数据质量、推断边界。all projects' common weakness
FinSkills Layer可复用金融认知原子能力。aifinlab selected skills taxonomy
Pre-Execution Checkpoint策略、风险、配置和提醒的执行前认知检查。martinpmm / Chelae action risk + aifinlab risk tools

4.3 Evaluation-Level Absorption

当前 evaluation/finclaw/case-library.md 应继续作为 FinClaw 体系评测基线,并新增三个方向的后续结构化落地:

  1. cases/:把 Cognition-Matrix-*Real-Chat-*Report-Pipeline-* 抽为 YAML。
  2. runs/:把四个项目的正式评测结果转为结构化 run result。
  3. reports/:持续产出横向对比、吸收矩阵和产品方案建议。

5. What FinClaw Should Not Absorb Directly

Do Not AbsorbReasonSafer Translation
默认创建 cron / heartbeat / alert容易在 soft ask 下产生持久化副作用。先生成 Pre-Execution Checkpoint,再由用户确认是否进入任务系统。
meme launch / wallet / token launch属于高风险执行或发行链路。仅作为外部参考和风险识别 case,不进入 MVP。
全量横向 SkillHub容易把 FinClaw 拉成泛金融技能仓库。只吸收与认知对象直接相关的 FinSkills。
报告生成器定位会把 FinClaw 收窄为 artifact pipeline。报告是 snapshot/thread 的输出形式之一。
无 provenance 的强结论四个参考项目共同弱项。每个结论必须绑定证据、时间和数据质量说明。
“已执行”式话术参考项目多次出现 action-state truthfulness 风险。区分 proposed / confirmed / executed / unavailable。

6. FinClaw Scheme Design Recommendation

6.1 Positioning

建议继续使用当前上位定义:

FinClaw 是 FinTec AI Ecosystem 中的独立金融认知产品 / 系统,位于金融信息感知和交易执行之间。

对外当前不建议直接使用 Financial Cognition Operating System 做第一阶段产品承诺。它可以保留为战略完整态表达;MVP 应表达为:

面向个人用户的金融认知产品,帮助用户围绕加密资产、主题、事件和叙事形成可复查、可更新、可追踪的结构化市场认知。

6.2 First-Stage Product Shape

建议第一阶段产品形态是:

Chat entry
-> Market Cognition Snapshot
-> Market Cognition Thread
-> Evidence / Data Quality Layer
-> Brief / Report / Watch Questions
-> Pre-Execution Checkpoint

这意味着:

  1. Chat 是入口,不是产品本体。
  2. Report 是输出形态,不是产品本体。
  3. FinSkills 是能力单元,不是产品本体。
  4. Thread 是 MVP 最关键的持续价值对象。

6.3 MVP Objects

建议 MVP 收敛为六个对象:

ObjectRole
Market Cognition Snapshot单次结构化认知快照。
Market Cognition Thread持续跟踪同一资产、主题、事件或 thesis。
Evidence Item来源、时间、口径、证据类型和关联结论。
Data Quality Note实时 / 延迟 / 模拟 / 降级 / 不可用 / 需复核。
Watch Question后续需要观察、验证或分工的问题。
Pre-Execution Checkpoint进入执行系统前的风险、前提、边界和确认清单。

6.4 MVP Experience Flow

建议第一阶段优先验证以下用户闭环:

  1. 用户提出真实问题:例如“BTC 又抽风了,我是不是看错了?”
  2. FinClaw 识别对象、语境和用户情绪。
  3. 生成 Market Cognition Snapshot:事实、推断、风险、反方、未知项。
  4. 绑定 Evidence Item 和 Data Quality Note。
  5. 将快照加入 Market Cognition Thread。
  6. 生成后续 Watch Questions 和复盘点。
  7. 若用户要求提醒、补仓、减仓、对冲或执行动作,只生成 Pre-Execution Checkpoint,不直接执行。

6.5 FinAgents / FinSkills Design Direction

建议把 FinAgents / FinSkills 的第一阶段职责压窄:

LayerFirst-Stage RoleReference Lesson
FinSkills原子金融认知能力,如行情解释、事件拆解、证据抽取、风险映射、数据质量标注。来自 aifinlab,但必须重写边界和证据字段。
FinAgents围绕用户问题组合 FinSkills,生成 snapshot/thread/brief/checkpoint。不做泛金融任务执行器。
Orchestration根据问题类型选择 cognition path。吸收 Chelae / martinpmm 的自然 chat 与画像,但加上 evidence guardrail。
Report Renderer把 snapshot/thread 转为可读 artifact。吸收 FinRobot 的报告结构和图表思路。

6.6 Priority Recommendation

建议后续推进优先级:

PriorityWorkstreamReason
P0结构化认知对象和 thread 体验这是 FinClaw 区别于普通 chat 和 report generator 的核心。
P0Evidence / Data Quality 标准这是四个参考项目共同弱项,也是 FinClaw 的质量壁垒。
P0真实用户语言 case 回归martinpmm / Chelae 证明真实 chat 体验很关键。
P1FinSkills MVP 白名单从 aifinlab taxonomy 中筛出与 crypto cognition MVP 直接相关的技能。
P1Report / Brief 输出从 FinRobot 吸收报告形态,但不把它作为唯一主体验。
P2Proactive loop / reminders有价值但副作用风险高,必须等待确认机制和状态真实性设计。
P2多市场 / 机构技能扩展可作为完整态,不应抢占 crypto MVP 闭环。

7. Proposed Next Step

下一批建议不要继续新增参考项目,而是进入 “FinClaw Evaluation-to-Product Translation”:

  1. 从本文抽取 FinClaw MVP Absorption Matrix
  2. 将四类参考能力映射到 mvp-product-definition.md 的 P0 / P1 / P2。
  3. evaluation/finclaw/cases/ 设计第一批结构化 case YAML。
  4. 准备后续工程协同输入包时,只引用已收敛对象,不把参考项目实现细节直接下推给工程。