跳到主要内容

Data Horizon / 数据视界 项目锚点

状态:基线收束草案 最后更新:2026-05-15 项目:Data Horizon / 数据视界 项目类型:前台独立系统 / 产品 生态角色:金融信息感知系统

1. 本文档定位

本文档是 Data Horizon / 数据视界 项目的入口锚点。

它用于说明:

  • Data Horizon / 数据视界 在生态中是什么;
  • 为什么它应作为独立系统 / 产品存在;
  • 它当前拥有和不拥有的职责;
  • 第一阶段应优先证明什么;
  • 它与 FinClawAI Trading Matrix 和后续基础设施层之间的关系。

本文档不替代后续正式产品定义、MVP 定义、PRD 或系统设计文档。

2. 项目定义

Data Horizon / 数据视界 是 FinTec AI Ecosystem 中的独立金融信息感知系统。

它的核心职责是对外部金融世界中的非结构化信息和结构化信息进行感知、采集、组织、标准化和上游输出,使这些信息能够被人类用户、FinClawAI Trading Matrix 或外部客户消费。

它不是:

  • 纯数据仓库;
  • 只面向内部生态的底层数据模块;
  • FinClaw 的下游摘要前处理器;
  • AI Trading Matrix 的交易信号生成附属模块。

3. 生态角色

在当前 3 + 2 生态结构中,Data Horizon / 数据视界 属于三个前台独立系统 / 产品之一。

它位于金融信息链路的感知环节:

金融信息感知
-> 金融认知与研究分析
-> 交易执行
-> 反馈与学习
-> 金融领域模型能力沉淀

该位置说明 Data Horizon / 数据视界 与其他对象存在协同关系,但不意味着第一阶段必须依赖其他对象才能成立。

4. 为什么独立存在

Data Horizon / 数据视界 应作为独立系统 / 产品存在,原因是:

  • 金融信息感知本身就是独立问题,不只是其他产品的输入准备;
  • 金融信息既包括自然语言文字、语音、视频等非结构化信息,也包括行情、K 线、成交量、财务数据等结构化信息;
  • 信息源、来源可信度、时效、噪声、缺失、标准化和可追溯性,需要独立产品和系统能力处理;
  • 它可以形成面向人类用户、内部系统或外部客户的独立信息产品 / 服务;
  • 如果感知层被压缩成某个下游系统的隐藏模块,生态会失去清晰的上游输入边界。

5. 当前拥有的职责

Data Horizon / 数据视界 当前拥有:

  • 金融信息感知、采集、组织和标准化;
  • 非结构化金融信息与结构化金融数据的统一上游处理;
  • 来源、时间、质量、可信度和缺失信息的显式标记;
  • 面向下游消费的结构化信息输出;
  • 支撑独立金融信息产品 / 服务的基础链路;
  • 在合法、授权和可治理边界内处理公开或非公开信息来源。

6. 当前不拥有的职责

Data Horizon / 数据视界 当前不拥有:

  • 替代 FinClaw 做金融认知、研究分析、策略解释或决策支持;
  • 将感知到的信息包装成确定性金融结论;
  • 替代 AI Trading Matrix 做交易执行、交易辅助、账户操作或真实交易执行;
  • 直接承担 Reinforcement Learning Engine 的反馈学习职责;
  • 直接承担 Financial Expert Foundation Model 的长期领域模型能力建设职责;
  • 在缺少授权、合规或治理边界时接入和处理非公开信息。

7. 第一阶段目标

第一阶段目标不是一次性打通完整生态主链路。

第一阶段应优先证明:

Data Horizon / 数据视界 能作为独立金融信息感知系统形成最小闭环。

当前第一阶段工作性目标:

  • 目标对象:需要持续获得金融信息、事件、数据和上下文输入的人类用户、内部团队或系统消费方;
  • 核心输入:公开市场信息、结构化金融数据、非结构化内容、事件流、项目更新和后续合法授权的信息源;
  • 核心链路:感知、采集、清洗、组织、标准化、来源 / 时间 / 质量标记和输出;
  • 可交付输出:结构化信息流、事件 / 信号摘要、来源包、信息质量标记和可被下游消费的感知对象;
  • 价值验证:输出是否比原始信息更可查、可用、可追踪、可消费,并能支持后续认知或执行支持系统减少输入混乱。

8. 关键输出对象

后续产品定义或 MVP 定义可进一步细化以下工作性对象。详细的分层盘点、状态标记和参考评估优先级见 output-object-inventory.mdreferences/data-horizon/README.md §7。

  1. Financial Information Feed 按资产、主题、市场、事件或时间窗口组织的金融信息流。

  2. Perception Record 对单条信息、事件、数据点或内容片段的感知记录,包含来源、时间、类型、质量和处理状态。

  3. Event / Signal Digest 对重要市场事件、项目更新、价格 / 数据异常或主题变化的结构化摘要。

  4. Source / Evidence Package 支撑某个信息对象的来源集合、证据链、时间上下文和可信度说明。

  5. Data Quality / Provenance Metadata 标记信息来源、更新时间、缺失字段、可信度、处理方式和适用限制的元数据。

这些对象不是最终结构定义,只是后续产品定义、协同边界讨论和 MVP 拆解的工作性锚点。具体工程化对接设计应由项目落地环节承接。

9. 生态接口

9.1 与 FinClaw

Data Horizon / 数据视界 -> FinClaw 是当前最高优先级接口之一。

该接口应重点澄清:

  • 上游感知输出是什么对象;
  • 在认知开始前,信息已经被结构化到什么程度;
  • 来源、时间、质量和缺失信息如何传递;
  • 哪些内容仍只是感知对象,不能被当成金融认知结论;
  • FinClaw 如何消费感知输出并形成结构化认知。

第一阶段约束:

  • Data Horizon / 数据视界 不以 FinClaw 完整实现为硬依赖;
  • FinClaw 也不以 Data Horizon / 数据视界 完整输入为硬依赖;
  • 双方接口应在各自独立闭环可描述后再正式定义。

9.2 与 AI Trading Matrix

Data Horizon / 数据视界 也可能向 AI Trading Matrix 提供影响执行支持的结构化信息、事件或信号。

该接口应重点澄清:

  • 哪些输出只是信息或信号,不构成交易指令;
  • 何时需要引入授权、风控、审计和执行治理;
  • 哪些结果或失败案例可回流改善感知质量。

第一阶段约束:

  • Data Horizon / 数据视界 不直接生成真实交易执行;
  • 任何触及账户、订单、资金、合约、私钥或自动执行的能力,都不属于 Data Horizon / 数据视界 当前职责。

9.3 与 Reinforcement Learning Engine

当真实使用数据、反馈数据和下游消费结果出现后,Data Horizon / 数据视界 可为 Reinforcement Learning Engine 提供:

  • 信息质量反馈;
  • 来源可靠性反馈;
  • 下游消费效果反馈;
  • 失败案例、误报、漏报和延迟案例。

第一阶段约束:

  • 不因未来学习闭环而提前建设复杂反馈基础设施;
  • 先定义哪些反馈能够证明感知链路可被改进。

9.4 与 Financial Expert Foundation Model

Financial Expert Foundation Model 未来可反哺 Data Horizon / 数据视界 的信息理解、分类、抽取、结构化和质量判断能力。

第一阶段约束:

  • 不以模型愿景替代感知产品闭环;
  • 不用模型权威感掩盖来源不明、时效不足或质量不确定的信息。

10. 文档下推链路

Data Horizon / 数据视界 后续正式文档应按以下链路下推:

  1. 项目锚点 先固定项目定义、生态角色、边界、第一阶段目标和接口关系。

  2. 继承上下文 从生态基线、项目注册表和治理规则继承正式口径。

  3. 当前状态 记录当前 alpha / 实验 / 已有材料、缺口、风险、开放问题和下一步。

  4. 产品 / 系统级 context 在成熟度足够时补齐 CONTEXT.md,承载项目级领域语言、产品 / 系统级 context 对齐和已解决歧义。

  5. 产品定义与 MVP 定义 从项目锚点和 context 下推第一阶段用户、输入、输出、能力范围、验收标准和风险边界。

11. 当前材料状态

当前可用材料包括:

  • projects/data-horizon/project-anchor.md
  • projects/data-horizon/inherited-context.md
  • projects/data-horizon/current-state.md
  • projects/data-horizon/current-practice-profile.md
  • projects/data-horizon/output-object-inventory.md
  • references/data-horizon/README.md
  • packets/sync/data-horizon-alignment-packet-2026-05-12.md
  • packets/sync/data-horizon-doc-ia-audit-2026-05-15.md
  • README.md
  • INDEX.md
  • baseline/03-current-baseline.md
  • registry/project-registry.md
  • governance/project-context-template.md

其中,inherited-context.md 仅在生态基线变更时同步。current-practice-profile.mdoutput-object-inventory.md 仍需运行态证据和参考评估结果补充。

12. 当前下一步

以下列表按 R4 audit(packets/sync/data-horizon-doc-ia-audit-2026-05-15.md)§8 更新:

  1. 重写 inherited-context.md:已完成首轮基线校准,仅在生态基线变更时同步;
  2. 重写 current-state.md:已完成首轮校准,本轮做 rewrite-lite 更新;
  3. 建立参考层入口:已完成 references/data-horizon/README.md
  4. 补运行态 evidence 到 current-practice-profile.md
  5. 建立 reference evaluation shortlist(在 references/data-horizon/);
  6. 完成参考评估后判断是否创建 product-definition.md
  7. 判断是否需要建立 projects/data-horizon/CONTEXT.md

13. 回流条件

以下情况应向生态层触发 sync / escalation:

  • Data Horizon / 数据视界 的感知边界无法支撑当前生态定义;
  • Data Horizon / 数据视界 开始承担金融认知、策略判断或执行职责;
  • FinClawAI Trading Matrix 的接口无法用当前基线解释;
  • 第一阶段用户、消费对象、输出对象或商业化路径发生根本变化;
  • 非公开信息、数据授权、合规或用户误导风险超出当前治理口径。

14. 相关文档