Data Horizon / 数据视界战略白皮书（大白话版）

它服务于团队快速阅读、口头转述和跨角色对齐。正式战略口径仍以战略白皮书为准；系统 / 产品定义、实施方案和工程设计会在后续必要文档中继续展开。

一句话讲明白

Data Horizon 要做的是一套 金融感知资产生产与输出系统。

更直白地说：它要把公开新闻、公告、社媒、私域/KOL 信息、交易所数据包、行情数据、图片、音视频和其他金融信息，放进一套可运行的系统里，让这些信息不只是“被看到”，而是能被接入、解析、去重、标准化、追踪来源、判断质量、沉淀入库，并交付给人和系统使用。

Data Horizon 在 FinTec AI Ecosystem 中的感知环节位置

图 1：Data Horizon 负责把外部金融信息世界转化为金融感知资产，再供给 FinBayes、AI Trading Matrix、RLE 和 FEFM。

它在 FinTec AI Ecosystem 里负责什么

FinTec AI Ecosystem 可以简单理解成一条金融信息链路：

在这条链路里：

Data Horizon 是“感知层”，负责发现、接入、处理和输出金融信息资产。
FinBayes 是“认知层”，负责把信息变成分析、判断、风险、反证和研究结论。
AI Trading Matrix 是“执行层”，负责把信号、策略和假设放进市场环境里验证和运行。

所以，Data Horizon 的关键价值不是替下游做研究或交易，而是让下游拿到更可靠、更可追踪、更可复用的金融信息输入。

为什么现在需要它

金融市场从来不缺信息，但现在的问题变了。

过去很多优势来自更快拿到行情、K 线、成交量、财务指标和公告。现在这些结构化信息仍然重要，但越来越容易被工具化和商品化。

新的压力来自另一边：新闻、社媒、政策、研报、KOL、社区讨论、直播、图片、音视频、AI 生成内容都在高速进入金融场景。它们有价值，但也更乱、更重复、更难追踪来源，更容易消耗人的注意力。

金融信息优势迁移

图 2：新的优势不只是“更早看到信息”，而是持续把复杂信息流变成可使用的金融感知资产。

AI 让更多人更快理解信息，也让信息生产、改写和扩散变得更快。传统信息差被压缩，信息爆炸和噪声反而变得更严重。

Data Horizon 要解决的就是这个问题：让团队和系统不被信息淹没，而是持续把复杂金融信息变成可追踪、可标准化、可检索、可复用、可输出的资产。

它到底产出什么

Data Horizon 的核心产出不是单一数据库表，也不是普通资讯列表，更不是直接交易动作。

它产出的是金融感知资产。

金融感知资产生产链路

图 3：原始信息进入系统后，经过接入、清洗、去重、标准化、组织和溯源，最终沉淀为可消费的金融感知资产。

第一阶段重点沉淀三类资产：

公开金融信息资产 新闻、快讯、公告、政策、宏观指标、公开数据和公开社媒内容。
私域金融信号资产 KOL/KOC、私域频道、半公开社区里的观点、线索、情绪、风险提示和交易相关信号。
市场数据资产 K 线、成交、订单簿、交易量、行情快照和交易所历史数据包。

这些资产都可以有实时状态，也可以沉淀成历史资产。不要把“实时”和“历史”当成互斥分类；它们只是资产生命周期里的不同状态。

这个系统由哪些能力组成

Data Horizon 可以分成五个能力域：

Data Horizon 战略能力架构

图 4：五大域是能力地图，不是把真实业务流硬拆成五段。

信息接入域 负责把公开信息、私域信息、API 数据、交易所数据包和其他金融信息带进系统。
信息处理域 负责解析、清洗、去重、翻译、标准化、多模态处理和模型/规则处理。
信息资产域 负责资产沉淀、证据保留、状态管理、质量记录、索引、检索和复用。
资产输出域 负责把资产交付给数据视界管理系统、FinBayes、AI Trading Matrix 和后续其他消费方。
运营管理域 作为横向控制面，负责配置、观察、复核、干预、告警和输出控制。

这五个域不是团队边界、不是部署边界，也不是流程硬拆分。一个真实业务闭环可以跨多个能力域一体化完成。

第一阶段要跑通什么

Data Horizon 不是从零开始。已有早期系统已经覆盖部分采集、标准化、推送、Open API 和控制台能力。

第一阶段不是证明“系统能跑”，而是把已有能力校正到金融感知资产生产与输出的战略方向上。

Data Horizon 第一阶段战略实践闭环

图 5：第一阶段重点跑通实时公开信息、历史市场数据、私域/KOL 信息三类闭环，并优先建设数据视界管理系统。

第一阶段要完成三类闭环：

实时公开信息闭环 新闻、快讯、公告、指标和公开信息能从接入、处理、入库到输出形成可运行链路。
历史市场数据闭环 交易所历史数据包、K 线、订单簿、成交和交易量能导入、清洗、标准化入库、检索和复用。
私域/KOL 信息闭环 私域频道、KOL/KOC 和半公开高价值信息能获取、解析、复核、沉淀和输出。

其中实时公开信息闭环和私域/KOL 信息闭环优先级更高，因为它们直接承接 FinBayes、AI Trading Matrix 和内部运营的生态协同需求。历史市场数据闭环是基础资产闭环，用于补齐金融数据资产底座。

数据视界管理系统为什么优先

Data Horizon 第一阶段最优先要满足的内部产品形态，是 Data Horizon/数据视界管理系统。

原因很简单：如果内部团队看不见系统里发生了什么，就无法稳定支撑下游输出。

管理系统至少要让团队完成这些事：

配置信息来源和接入任务；
观察抓取、监听、解析、标准化、入库、输出状态；
查看公开金融信息资产、私域金融信号资产和市场数据资产；
对异常、低置信度、高价值或高风险信息进行复核和干预；
控制哪些资产、按什么规则、向哪些消费方输出；
查看输出结果、失败记录和下游反馈。

给 FinBayes 和 AI Trading Matrix 的数据输出，是第一阶段资产输出域的具体验证场景；但它们不应替代数据视界管理系统的第一优先级。

和 FinBayes、AI Trading Matrix 怎么协同

FinBayes 需要的是更可靠的研究材料、事件材料、数据材料、情绪材料、研报材料和证据材料。Data Horizon 给它提供可追溯的上游材料，FinBayes 负责进一步形成金融认知、风险分析和反证组织。

AI Trading Matrix 需要的是情报输入、事件输入、市场状态变化和交易信号候选。Data Horizon 可以说明某类信息值得进入交易决策流程，但是否形成策略、是否触发执行、如何授权和风控，属于 AI Trading Matrix 的职责。

下游系统也要把反馈回流给 Data Horizon：哪些信息有用，哪些噪声大，哪些延迟，哪些误报漏报，哪些来源质量下降，哪些输出成本过高。这样 Data Horizon 才能持续改进感知质量。

团队怎么判断第一阶段做成了

判断 Data Horizon 是否真正成立，核心看团队能不能持续回答下面这些问题：

哪些信息正在进入系统？
哪些信息已经成为可检索、可复用的金融感知资产？
每条资产能不能看到原始证据、来源、时间、处理状态和质量信息？
哪些异常需要人工复核或干预？
哪些资产正在输出给数据视界管理系统、FinBayes 和 AI Trading Matrix？
下游到底用了哪些资产，哪些被认为有价值，哪些被认为是噪声？
系统是否越来越能稳定生产、管理、复用和输出金融感知资产？

如果这些问题能被系统持续回答，Data Horizon 就不只是一个爬虫、资讯页或推送脚本，而是 FinTec AI Ecosystem 感知环节中真正可复利的金融感知资产系统。

和正式白皮书怎么对应

正式白皮书是战略事实源，适合做后续定义基线、系统 / 产品定义、参考评估和工程迭代的上游依据。

Data Horizon 后续文档下推关系

图 6：战略白皮书固定方向，定义基线承接共识，系统 / 产品定义先合并承接场景、对象、能力域和运行结构；后续如有必要再拆分。

这份大白话版适合团队快速阅读、口头转述和跨角色对齐。后续如果出现理解分歧，应以正式白皮书为准；如果正式白皮书需要调整，也应先回到战略定义层讨论清楚，再下推到系统 / 产品定义和实施方案。

Changelog / 演化记录

2026-05-26：认知层下游对象从 FinClaw 全文同步为 FinBayes，与生态对象注册表中 2026-05-24 完成的对象重命名对齐；maturity 收敛为模板枚举 active。SVG 图注中的 FinClaw 标签暂未同步，待后续 svg 重绘单独处理。

一句话讲明白​

它在 FinTec AI Ecosystem 里负责什么​

为什么现在需要它​

它到底产出什么​

这个系统由哪些能力组成​

第一阶段要跑通什么​

数据视界管理系统为什么优先​

和 FinBayes、AI Trading Matrix 怎么协同​

团队怎么判断第一阶段做成了​

和正式白皮书怎么对应​

Changelog / 演化记录​