Data Horizon / 数据视界 当前状态
状态:基线收束草案 最后更新:2026-05-15 项目:Data Horizon / 数据视界 阶段:已在推进 / 待完成第一阶段闭环定义
1. 本文档定位
本文档记录 Data Horizon / 数据视界 当前已经可确认的事实、事实等级、主要缺口、风险、开放问题和下一步。
它不替代:
-
project-anchor.md 项目定义、生态角色、职责边界和第一阶段目标。
-
inherited-context.md 从生态级基线、项目注册表和治理规则继承的上游口径。
-
后续
CONTEXT.md、产品定义、MVP 定义、PRD 或系统设计文档。
本文档的重点是回答:Data Horizon / 数据视界 目前已经站在哪里,距离第一阶段独立金融信息感知闭环还缺什么。
2. 当前状态摘要
当前可以确认:
Data Horizon / 数据视界已被生态层登记为三个前台独立系统 / 产品之一;- 当前生态定位是金融信息感知系统;
- 第一阶段目标是形成独立金融信息感知链路,并证明不依赖下游认知或执行系统时仍具备最小产品价值;
- 旧状态文档记录其已有 alpha 形态,并持续进行金融信息感知与信息扩充;
- 当前项目级锚点和继承上下文已完成第一轮基线校准。
当前仍未在本仓库登记清楚:
- alpha 当前可运行能力;
- 已接入的信息源、数据源、市场和资产范围;
- 已形成的输出对象、结构定义、样例和质量标记;
- 当前用户、消费对象或商业化验证对象;
- 与
FinClaw、AI Trading Matrix或外部客户的实际消费关系; - 第一阶段验收标准和验证证据。
因此,当前最核心的问题不是“是否已经开始做”,而是:
如何把已有 alpha / 实践事实映射为可被生态、项目和 Agent 共同继承的第一阶段感知闭环定义。
3. 当前已完成的文档状态
当前项目目录已有:
-
project-anchor.md 已校准为当前项目入口锚点。
-
inherited-context.md 已校准为上游继承上下文。
-
current-state.md 本文档,用于承接当前事实、缺口、风险、开放问题和下一步。
-
current-practice-profile.md 本地
/Users/mlabs/Programs/data-horizon工程实践画像初版,用于记录当前实现事实、声明能力与实际能力差异、文档漂移和初始挑战点。 -
output-object-inventory.md 当前输出对象清单初版,用于区分已实现、部分实现、历史文档提出、参考候选、后续候选和应避免的输出对象。
-
../../references/data-horizon/README.md 参考层入口,参考评估问题域、筛选原则、候选 shortlist 和回流关系。
-
../../packets/sync/data-horizon-doc-ia-audit-2026-05-15.md R4 项目文档 IA audit,文件角色标签、命名问题、处置建议和 open-gap 清单。
当前尚未建立:
CONTEXT.md(待参考评估后判断)- 产品定义文档
- MVP 定义文档
Data Horizon / 数据视界 -> FinClaw协同边界问题记录- 第一阶段感知范围说明
4. 当前已知进展
4.1 已确认进展
从当前仓库文档可以确认:
- 生态层已认可
Data Horizon / 数据视界的独立产品 / 系统身份; - 生态层已确认其覆盖非结构化金融信息和结构化金融数据;
- 生态层已确认它不只是内部数据底座,也应保持系统和商业上的独立性;
- 当前第一阶段不要求它依赖完整
FinClaw或AI Trading Matrix; - 后续最高优先级接口之一是
Data Horizon / 数据视界 -> FinClaw; - 它也可能向
AI Trading Matrix提供结构化信息、事件或信号,但这些输出不构成交易指令。
4.2 待核验进展
旧状态文档保留的待核验事实,已通过 current-practice-profile.md 形成静态仓库画像初版,但仍缺少运行态和样例证据:
- 已有 alpha 形态;
- 已持续进行金融信息感知;
- 已具备继续扩展数据 / 事件输入的实践基础。
这些判断后续仍需要用运行证据、样例输出、真实数据源清单、数据库现场状态或负责人说明补齐证据。
4.3 暂未登记事项
当前仓库已经登记:
- Data Horizon / 数据视界 的本地仓库目录:
/Users/mlabs/Programs/data-horizon; - 当前静态代码画像(
current-practice-profile.md); - 当前采集、标准化、去重、分类、抽取、推送、Open API 和控制台雏形;
- 当前旧 PRD / README 与上游治理定义之间的主要漂移;
- 当前输出对象清单(
output-object-inventory.md),含 22 个对象的分层盘点和状态标记; - 参考层入口(
references/data-horizon/README.md),含 10 维度评估问题域和三层输出对象参考优先级。 - 本地工程仓库
CONTEXT.md已形成一组 Data Horizon 领域语言和对齐边界候选,但它仍属于工程仓库输入,不替代本治理仓库中的正式项目上下文或产品定义。
当前仓库尚未登记清楚:
- alpha 对应的分支、版本、commit、部署环境或运行方式;
- 当前线上 / 本地数据库中的真实数据源清单;
- 当前真实样例输出、存储状态、API 返回样例、UI 截图或报告形态;
- 当前是否有真实用户、内部使用者、外部客户或系统消费方;
- 当前是否已有反馈数据、误报 / 漏报案例或质量评估样本;
- 参考评估候选 shortlist(
references/data-horizon/README.md§4 当前为空白)。 - 是否将本地工程仓库
CONTEXT.md中的领域语言吸收为projects/data-horizon/CONTEXT.md或其他治理正文。
5. 第一阶段闭环当前判断
当前第一阶段闭环尚未被正式定义。
根据项目锚点和继承上下文,第一阶段最小闭环至少需要补齐:
-
目标对象 谁需要持续获得金融信息、事件、数据和上下文输入。
-
核心输入 第一阶段优先覆盖哪些市场、资产、主题、信息源、数据类型和事件类型。
-
处理链路 如何完成感知、采集、清洗、组织、标准化、来源 / 时间 / 质量标记和输出。
-
输出对象 基于 output-object-inventory.md,在完成参考评估和决策后选择首批对象。
-
价值验证 如何证明输出比原始信息更可查、可用、可追踪、可消费,并能减少下游输入混乱。
-
非目标和风险边界 如何避免把感知输出包装成确定性金融结论、投资判断、交易指令或无授权执行依据。
6. 当前主要缺口
6.1 事实缺口
- alpha 代码、运行状态和能力范围尚未映射到本仓库;
- 当前信息源、数据源、市场和资产范围尚未登记;
- 当前输出对象已形成静态清单初版,但样例、质量标记和运行证据尚未登记完整;
- 当前用户或消费对象尚未明确;
- 当前可验证价值证据尚未整理。
6.2 产品定义缺口
- 第一阶段目标用户或消费对象未定;
- 第一阶段输入范围未定;
- 第一阶段输出对象未定;
- 第一阶段独立产品价值和商业化路径未定;
- 是否需要先建立
CONTEXT.md尚未决策;本地工程仓库CONTEXT.md可作为候选输入,但需要在参考评估和 Controller 判断后再吸收。
6.3 接口缺口
Data Horizon / 数据视界 -> FinClaw的输出对象、结构化程度、来源 / 时间 / 质量传递方式尚未定义;Data Horizon / 数据视界 -> AI Trading Matrix尚未区分信息 / 信号、执行支持输入和交易指令之间的边界;- 面向
Reinforcement Learning Engine的反馈类型尚未定义; Financial Expert Foundation Model未来反哺Data Horizon / 数据视界的方式尚未定义。
6.4 治理缺口
- 非公开信息的合法、授权和可治理边界尚未项目化;
- 数据来源、时效、缺失、可信度和适用限制尚未形成底线字段;
- 材料接入、事实源升级和 sync / escalation 触发条件尚未下推到项目工作流。
7. 当前风险
-
感知与认知边界模糊 如果输出对象没有质量标记和适用限制,下游可能把感知对象误读成金融认知结论。
-
alpha 事实无法被团队继承 如果已有实现不映射到项目文档,后续 Agent 和协作者会继续依赖口头理解。
-
过早被下游需求吞并 如果先从
FinClaw或AI Trading Matrix的需求反推系统边界,Data Horizon / 数据视界可能退化为附属数据模块。 -
风险边界不够显式 如果非公开信息、数据授权、来源可信度和时效边界没有被显式记录,后续产品化会积累合规和用户误导风险。
-
缺少可验证价值对象 如果不能说明输出相对原始信息的价值,第一阶段闭环会停留在“做了采集和整理”,而不是独立产品 / 系统验证。
8. 当前最重要的下一步
按 R4 audit(packets/sync/data-horizon-doc-ia-audit-2026-05-15.md)§8:
-
补强运行态 evidence 基于 current-practice-profile.md,补充当前 commit / 分支、启动方式、数据库现场、真实输入源、API 返回样例、控制台截图、样例输出和已知失败案例。证据留在工程仓库(
/Users/mlabs/Programs/data-horizon),画像回写到治理仓库。 -
建立 reference evaluation shortlist 在 references/data-horizon/README.md §4 补充首批候选参考对象。
-
推进第一阶段闭环输入 目标消费对象裁决、第一阶段感知范围、最小价值验证假设、quality / provenance 底线。
-
判断本地工程
CONTEXT.md吸收方式 只把已被治理仓库、参考评估或 Controller 判断确认的稳定语言吸收为项目级 context;不把工程仓库 context 直接升级为产品定义。 -
完成参考项目筛选、体验、测试、评估和交叉对比 在参考评估结果形成前,不进入产品定义、最小输出对象冻结或工程增强建议。
-
L1 reader test Rewrite-lite 完成后对
README.md、project-anchor.md、current-state.md做 L1 reader test。
9. 当前待决问题
Data Horizon / 数据视界 的本地代码仓库目录是什么?已确认:/Users/mlabs/Programs/data-horizon(见current-practice-profile.md§1)。- 当前 alpha 已能稳定完成哪些感知、采集、组织、标准化和输出动作?
- 第一阶段最小市场范围是加密、证券、宏观、项目事件,还是跨市场主题?
- 第一阶段最小消费对象是内部团队、人类金融用户、系统消费方、外部客户,还是金融虚拟 KOL / 内容矩阵?
- 第三方参考项目应优先回答哪些上位问题?
- 哪些参考项目可以挑战 Data Horizon 的感知能力、信息覆盖、标准化方式、存储检索、订阅推送、接口形态、产品交互、成本控制和治理合规?
- 当前本地实践画像与参考评估结果应如何对照吸收?
- 哪些能力一旦出现,就说明
Data Horizon / 数据视界已经越过感知边界进入认知或执行支持?
10. 何时需要向生态层回流
以下情况应触发 sync / escalation:
- 现有 alpha 实践说明当前感知边界无法成立;
- 某些本地信息对象、结构定义或质量标记应上升为生态级共享定义;
- 输出契约冲击
FinClaw的认知边界或AI Trading Matrix的交易执行边界; - 项目开始承接金融认知、策略判断、决策支持或真实交易执行职责;
- 非公开信息、数据授权、合规或用户误导风险超出当前治理口径;
- 第一阶段用户、消费对象、输出对象或商业化路径发生根本变化。
11. 相关文档
- project-anchor.md
- inherited-context.md
- ../../references/data-horizon/README.md
- ../../packets/sync/data-horizon-doc-ia-audit-2026-05-15.md
- ../../baseline/03-current-baseline.md
- ../../registry/project-registry.md
- ../../governance/material-intake-policy.md
- ../../governance/first-phase-product-closure.md
- ../../governance/project-context-template.md