Data Horizon / 数据视界 输出对象清单
状态:初版清单 最后更新:2026-05-12 项目:Data Horizon / 数据视界 上游定位:金融信息感知系统 / 金融“眼” 输入事实层:current-practice-profile.md
1. 本文档定位
本文档盘点当前 Data Horizon 本地工程实践、历史文档和候选方向中出现的输出对象。
本文档不是:
- MVP 输出集合;
- 最终结构定义;
- API 契约;
- 产品定义;
- 工程实现计划;
- 增强建议。
本文档用于回答:
当前 Data Horizon 已经输出、部分输出、历史上提出、参考候选或应该避免的对象分别是什么?
在完成参考评估和后续决策前,不应把本文档中的任何对象直接固化为第一阶段最小输出对象。
2. 状态标记
本文使用以下状态:
current implemented:当前代码中已有明确实现路径;current partial:当前已有部分字段、页面、接口或链路,但不足以作为稳定产品对象;documented but not implemented:历史文档或分析材料提出,但当前实现不足;reference candidate:后续参考评估可重点寻找和比较的对象;proposed later:可能有价值,但不应进入当前阶段冻结;should avoid:与 Data Horizon 感知边界冲突,或容易造成认知 / 执行越界。
3. 当前已实现输出对象
3.1 Raw News Record
状态:current implemented
当前含义:
dn_raw_news 中的原始金融信息记录,承载来源、标题、内容、语言、来源时间、处理状态、标准化内容、关联标的、扩展字段、耗时和错误。
当前主要消费者:
- 标准化任务;
- 内部 news-feed 控制台;
- Agent 处理路径;
- Open API 查询路径;
- 推送链路。
证据:
/Users/mlabs/Programs/data-horizon/docs/sql/dn_raw_news.sql:1定义dn_raw_news;/Users/mlabs/Programs/data-horizon/server/internal/standardize/standardize.go:125读取 pending raw news;/Users/mlabs/Programs/data-horizon/server/internal/job/raw_news_job.go:17描述处理已标准化 raw news;/Users/mlabs/Programs/data-horizon/server/internal/logic/news_feed/news_feed_list_logic.go:100将 raw news 转为控制台NewsFeedItem。
边界说明:
该对象目前同时承担 raw store、标准化结果和部分 operational status,后续需要挑战是否应拆分为 Raw Store、Perception Record、Normalized Store 或 Evidence Package。
3.2 Standardized News Record
状态:current implemented
当前含义:
写回 dn_raw_news 的标准化结果,包括 std_content_zh、std_content_en、subjects、std_extra、std_cost_ms、last_err。
证据:
/Users/mlabs/Programs/data-horizon/docs/sql/dn_raw_news.sql:15到docs/sql/dn_raw_news.sql:20定义标准化字段;/Users/mlabs/Programs/data-horizon/server/internal/standardize/standardize.go:56到server/internal/standardize/standardize.go:75定义标准化结果;/Users/mlabs/Programs/data-horizon/server/internal/standardize/standardize.go:180到server/internal/standardize/standardize.go:187更新标准化结果。
边界说明:
当前它是“标准化新闻记录”,不等同于正式 Perception Record。它缺少稳定的质量、授权、适用限制、证据包和生命周期字段。
已对齐口径:
Standardized News Record 是候选核心输出对象的上游材料,可为 Perception Record 或 Financial Information Feed Item 提供内容与字段来源,但当前 dn_raw_news 中的字段结构不应直接固化为 Data Horizon 第一阶段正式结构定义。
3.3 Internal News Feed Item
状态:current implemented
当前含义:
内部控制台 news-feed 返回的消息项,展示来源、原文、标准化内容、状态、关联标的、耗时、错误和采集时间。
证据:
/Users/mlabs/Programs/data-horizon/server/api/news_feed.api:53到server/api/news_feed.api:71定义NewsFeedItem;/Users/mlabs/Programs/data-horizon/server/internal/logic/news_feed/news_feed_list_logic.go:100到server/internal/logic/news_feed/news_feed_list_logic.go:142构造响应;/Users/mlabs/Programs/data-horizon/web/src/views/datahorizon/news-feed/下存在 feed 页面组件。
边界说明:
这是内部运营控制台对象,不应直接等同于外部产品对象或生态接口对象。
3.4 Open News Item
状态:current implemented
当前含义:
Open API 列表项,面向 API Key 认证消费者返回标准化新闻摘要、来源、语言、时间、资产、分类和关键词。
证据:
/Users/mlabs/Programs/data-horizon/server/api/open.api:45到server/api/open.api:57定义OpenNewsItem;/Users/mlabs/Programs/data-horizon/server/api/open.api:91到server/api/open.api:117定义 latest / search 响应;/Users/mlabs/Programs/data-horizon/server/internal/logic/open/open_news_latest_logic.go:44到server/internal/logic/open/open_news_latest_logic.go:58查询并转换 latest;/Users/mlabs/Programs/data-horizon/server/internal/logic/open/open_news_search_logic.go:44到server/internal/logic/open/open_news_search_logic.go:58查询并转换 search。
边界说明:
当前 OpenNewsItem 是 API 响应对象,不是内部稳定对象协议。它也尚未表达 provenance、授权、重要度、质量或来源限制。
已对齐口径:
Open News Item 暂时只视为当前 Open API 响应对象和候选材料,可为未来 Financial Information Feed Item 或 Retrieval Result 提供字段参考,但不能直接代表 Data Horizon 的 To B / To C 正式产品对象。
3.5 Open News Detail
状态:current implemented
当前含义:
Open API 详情项,包含完整标准化内容和原文链接。
证据:
/Users/mlabs/Programs/data-horizon/server/api/open.api:59到server/api/open.api:73定义OpenNewsDetail;/Users/mlabs/Programs/data-horizon/server/api/open.api:119到server/api/open.api:126定义 detail 响应。
边界说明:
详情对象补充了内容与 URL,但仍不是证据包,也不是完整 provenance 对象。
已对齐口径:
Open News Detail 与 Open News Item 同样属于当前接口响应对象。它可以作为后续接口形态参考评估的输入,但不直接升级为正式外部产品对象。
3.6 Category List
状态:current implemented
当前含义:
Open API 公开的事件分类列表,用于解释 category code。
证据:
/Users/mlabs/Programs/data-horizon/server/api/open.api:75到server/api/open.api:80定义OpenCategoryItem;/Users/mlabs/Programs/data-horizon/server/api/open.api:128到server/api/open.api:133定义 categories 响应;/Users/mlabs/Programs/data-horizon/server/api/open.api:164到server/api/open.api:166暴露 categories 接口。
边界说明:
这是辅助元数据对象,不是主要金融信息输出对象。
3.7 Hot Asset Item
状态:current implemented
当前含义:
Open API 公开的热门资产统计项,按时间窗口统计资产相关新闻数量和最新标题。
证据:
/Users/mlabs/Programs/data-horizon/server/api/open.api:82到server/api/open.api:87定义OpenHotAssetItem;/Users/mlabs/Programs/data-horizon/server/api/open.api:135到server/api/open.api:142定义 hot assets 请求和响应。
边界说明:
这是信息流衍生统计,不应被解读为趋势判断、交易信号或资产推荐。
3.8 Push Log Entry
状态:current implemented
当前含义:
dn_push_log 中的推送执行记录,记录来源、目标、payload、状态、错误、幂等 key、HTTP 状态和耗时。
证据:
/Users/mlabs/Programs/data-horizon/docs/sql/dn_push_log.sql:1到docs/sql/dn_push_log.sql:35定义 push log;/Users/mlabs/Programs/data-horizon/server/internal/job/push_message_job.go:27到server/internal/job/push_message_job.go:78扫描 pending logs 并发送;/Users/mlabs/Programs/data-horizon/server/internal/job/push_message_job.go:220到server/internal/job/push_message_job.go:232更新 push log 状态。
边界说明:
这是 operational output,不是金融信息产品对象。它可以为可观测性和审计提供证据。
已对齐口径:
Push Log Entry 降级为 operational / observability object,用于审计、失败恢复、成本和分发证据,不纳入 Data Horizon 第一阶段正式核心输出对象。
3.9 Direct Push Payload
状态:current implemented
当前含义:
按 dn_raw_news_direct 配置生成的 Telegram、Webhook 或 TM 目标 payload。
证据:
/Users/mlabs/Programs/data-horizon/docs/sql/dn_raw_news_direct.sql:8到docs/sql/dn_raw_news_direct.sql:25定义直推配置;/Users/mlabs/Programs/data-horizon/server/internal/job/raw_news_job.go:108到server/internal/job/raw_news_job.go:167读取直推配置并生成 push log;/Users/mlabs/Programs/data-horizon/server/api/raw_news_direct.api:31到server/api/raw_news_direct.api:38定义批量添加直推配置请求。
边界说明:
直推 payload 是分发产物,不应被视为 Data Horizon 的核心领域对象。特别是 tm 目标只表示输出目标,不代表交易执行权限。
已对齐口径:
Direct Push Payload 降级为 delivery artifact,可用于接口和分发链路评估,但不作为核心产品输出。tm 目标不能反向定义 Data Horizon 为 Trading Matrix 附属模块。
3.10 Agent Execution Result
状态:current implemented
当前含义:
Agent 对 raw news 或时间窗口新闻执行分析后的记录,包含 prompt、result、状态、耗时和错误。
证据:
/Users/mlabs/Programs/data-horizon/docs/sql/dn_agent_execution.sql:11到docs/sql/dn_agent_execution.sql:37定义执行记录;/Users/mlabs/Programs/data-horizon/server/internal/agent/agent.go:12到server/internal/agent/agent.go:18定义 realtime / schedule 两种 Agent 接口;/Users/mlabs/Programs/data-horizon/server/internal/agent/analyst_agent.go:176到server/internal/agent/analyst_agent.go:208创建并更新实时执行记录;/Users/mlabs/Programs/data-horizon/server/internal/job/analyst_schedule_job.go:14到server/internal/job/analyst_schedule_job.go:21描述定时聚合分析任务。
边界说明:
该对象明显接近“分析 / 认知”边界。它可以作为当前工程事实存在,但进入正式 Data Horizon 输出集合前必须被挑战:哪些部分属于感知增强,哪些已经越过金融眼边界。
已对齐口径:
Agent Execution Result 暂时保留为当前工程实践对象、内部运营对象和 challenge object,不纳入 Data Horizon 第一阶段正式核心输出对象。后续需要判断它应被拆分为感知增强摘要、内部处理日志、FinClaw 认知输入,还是迁移到 FinClaw / FEFM 类系统。
3.11 LLM / Translate Usage Stats
状态:current implemented
当前含义:
LLM 与翻译调用统计,用于观察调用次数、失败、token、字符数、耗时和费用估算。
证据:
/Users/mlabs/Programs/data-horizon/docs/sql/dn_llm_call_log.sql:9到docs/sql/dn_llm_call_log.sql:29定义 LLM 调用日志;/Users/mlabs/Programs/data-horizon/docs/sql/dn_translate_call_log.sql:8到docs/sql/dn_translate_call_log.sql:29定义翻译调用日志;/Users/mlabs/Programs/data-horizon/server/api/statistics.api:4到server/api/statistics.api:40定义 LLM 配置统计;/Users/mlabs/Programs/data-horizon/server/api/statistics.api:122到server/api/statistics.api:144定义翻译服务统计;/Users/mlabs/Programs/data-horizon/server/internal/logic/statistics/llm_config_stats_logic.go:57到server/internal/logic/statistics/llm_config_stats_logic.go:62估算 token 成本。
边界说明:
这是成本与可观测性对象,不是金融信息输出对象。它对 Data Horizon 长期成本控制很关键。
4. 当前部分实现输出对象
4.1 Perception Record
状态:current partial
候选级别:第一阶段核心候选对象
当前对应:
Raw News Record + Standardized News Record + 基础 provenance 字段。
缺口:
- 缺少稳定对象命名;
- 缺少质量标签;
- 缺少授权 / 来源限制;
- 缺少修订 / 生命周期;
- 缺少证据包关系;
- 缺少人工复核状态。
判断:
当前实现已具备形成 Perception Record 的材料,但还不是正式感知记录对象。
已对齐口径:
Perception Record 是 Data Horizon 第一阶段核心候选对象,但不是当前 dn_raw_news 的直接改名,也不在当前阶段冻结结构定义。它应从 Raw News Record、Standardized News Record、Source / Evidence Metadata 和 Data Quality / Provenance Metadata 综合演化;是否成为第一阶段最小输出对象,等待质量 / provenance 评估维度和参考评估后再决策。
4.2 Financial Information Feed
状态:current partial
候选级别:第一阶段核心候选消费面
当前对应:
- Open API latest / search;
- 内部 news-feed;
- Telegram / webhook push;
- 订阅者和直推配置。
缺口:
- feed 类型未定义;
- 面向人类、机器、数据集的 feed 未区分;
- 未明确排序、时效、质量、授权和更新语义;
- streaming feed、bulk feed 和 query feed 未区分。
判断:
当前已有多个 feed 形态,但缺少统一产品对象和协议边界。
已对齐口径:
Financial Information Feed 是 Data Horizon 第一阶段核心候选消费面,可按时间、资产、主题、来源、质量或订阅规则组织一个或多个 Perception Record。它可以形成内部控制台 feed、Open API feed、机器 feed、订阅推送 feed 或后续 dataset feed,但当前 Open API、news-feed 和 push 都只是材料,不直接等于正式 feed。
4.3 Source / Evidence Metadata
状态:current partial
当前对应:
source_id、source_name、source_author、source_type、source_url、source_timestamp;dn_crawler_source的平台、语言、分类、KOL、tags、std_config;- Push log 的 from / target / idempotent。
缺口:
- 证据集合未建模;
- 来源授权和使用限制未建模;
- 多源聚合关系未建模;
- 来源可信度与时效等级未建模;
- 原文快照 / 摘要 / 证据包未明确。
判断:
当前已有来源元数据,但还不是 Source / Evidence Package。
4.4 Data Quality / Provenance Metadata
状态:current partial
候选级别:必备元数据层,暂非独立产品输出对象
当前对应:
- 处理状态;
- 标准化耗时;
- 最后错误;
- repeat news id;
- LLM / 翻译调用日志;
- push 成功 / 失败。
缺口:
- 质量标签;
- 信息可信度;
- 字段缺失;
- 来源授权;
- 适用限制;
- 人工复核;
- 版本和修订历史;
- 下游反馈对质量的影响。
判断:
当前系统有可观测字段,但没有完整质量 / provenance metadata 对象。
已对齐口径:
Data Quality / Provenance Metadata 是 Data Horizon 必备元数据方向和候选支撑层,应支撑 Perception Record、Financial Information Feed、Evidence Package 和 Dataset Package 等对象。当前阶段不把它作为独立产品输出对象;后续若进入 B 端数据质量服务或模型训练数据包方向,再评估是否独立产品化。
当前只确认 Data Quality / Provenance Metadata 是必须被参考评估覆盖的上位维度,用于 challenge 当前实践是否具备可追溯、可解释、可复核、可治理的金融信息感知能力。此文档不保留字段分层,不定义字段清单、结构定义、权重、打分公式、接口暴露策略或工程补齐要求。
第一阶段仍禁止用交易表现、PnL 或预测准确率作为来源可靠性的定义依据。后续若需要提出具体字段,必须先完成参考项目筛选、体验、测试、评估、交叉对比,以及当前实践画像补充。
4.5 Internal Operations View Object
状态:current partial
当前对应:
- DataHorizon 控制台页面;
- news-feed source tree / header / list;
- Agent execution;
- LLM / translate statistics;
- source、KOL、subscriber、Telegram topic、MCP key 管理。
缺口:
- 工作流对象未统一;
- 复核、标注、恢复、导出、证据打包能力不足或未证实;
- 成本监控仍偏 LLM / 翻译;
- 页面对象和运营任务对象未区分。
判断:
控制台对象已经有雏形,但应按工作流能力继续 inventory,而不是按现有页面命名固化。
5. 历史文档提出但未实现或不宜直接承接的对象
5.1 Standard Financial Event
状态:documented but not implemented
历史含义:
旧 PRD 中提出面向 Trading Matrix 的标准金融事件,例如包含 subject、action、probability、impact、timestamp。
证据:
/Users/mlabs/Programs/data-horizon/docs/prd/product-definition.md:21到docs/prd/product-definition.md:23给出事件输出示例;/Users/mlabs/Programs/data-horizon/docs/prd/product-definition.md:49到docs/prd/product-definition.md:51描述向 Trading Matrix 推送 Standard Event。
风险:
probability、impact、action 容易进入认知、判断或执行支持边界。
当前处理:
暂不作为正式输出对象。后续若保留,应被重新命名和边界化为感知阶段事件摘要,并移除交易判断暗示。
5.2 Trading Signal
状态:should avoid
历史含义:
旧 PRD 将 Data Horizon 输出写成机器可读“交易信号”。
证据:
/Users/mlabs/Programs/data-horizon/docs/prd/product-definition.md:7使用“交易信号”;/Users/mlabs/Programs/data-horizon/docs/prd/product-definition.md:9将噪音提炼为决策信号。
风险:
该对象容易把 Data Horizon 从感知层推向认知 / 执行支持层。
当前处理:
在正式 Data Horizon 边界内应避免使用“交易信号”作为核心输出对象。可以用“机器 Feed”“感知摘要”“事件候选”替代,但具体命名需后续决策。
5.3 Deep Intelligence
状态:should avoid
历史含义:
旧 PRD 将人类可读输出称为“深度情报”。
证据:
/Users/mlabs/Programs/data-horizon/docs/prd/product-definition.md:7使用“深度情报”。
风险:
“深度情报”容易暗示研究结论、策略解释和认知分析,和 FinClaw 边界重叠。
当前处理:
不应直接作为 Data Horizon 第一阶段输出对象。若需要人类产品面,应改用更明确的“人类信息产品”“内部信息流”“复核视图”等候选对象。
5.4 RMF Attribution Report
状态:should avoid
历史含义:
旧 PRD 设想 Trading Matrix 向 Data Horizon 回传归因战报,用交易结果校准数据源和信号。
证据:
/Users/mlabs/Programs/data-horizon/docs/prd/product-definition.md:52到docs/prd/product-definition.md:55描述 RMF Loop;/Users/mlabs/Programs/data-horizon/docs/prd/product-definition.md:80到docs/prd/product-definition.md:84描述后验校准和 RMF 接口管理。
风险:
该对象属于反馈学习和执行结果关联,不应作为 Data Horizon 当前阶段输出对象。未来可作为协同反馈输入候选,但必须由生态治理裁决边界。
当前处理:
暂列为应避免对象,不进入第一阶段输出对象清单。
5.5 Verified Intelligence
状态:proposed later
历史含义:
旧 PRD 面向外部机构 / C 端订阅者提出“实盘验证级情报”。
证据:
/Users/mlabs/Programs/data-horizon/docs/prd/product-definition.md:28到docs/prd/product-definition.md:31描述外部商业化用户和 Verified Intelligence。
风险:
涉及真实交易验证、用户误导、合规和商业承诺,不适合当前阶段。
当前处理:
作为远期商业化概念保留观察,不进入当前输出对象。
6. 参考评估候选输出对象
以下对象不是方案建议,只是后续 reference evaluation gate 可寻找和比较的对象。
6.1 Dataset Package
状态:reference candidate
候选级别:二阶产品对象,暂不进入第一阶段核心候选
待评估问题:
- 金融信息感知系统如何把采集和标准化结果打包为可训练、可评估、可复现的数据集?
- dataset manifest 应包含哪些来源、授权、时间、字段、质量和版本信息?
- 面向 FEFM 训练、FinClaw 评估和外部 B 端交付是否需要不同 dataset package?
当前对应:
当前仓库尚未见稳定 dataset package 输出。
已对齐口径:
Dataset Package 是重要 reference candidate 和 second-order product object,可服务 FEFM 训练、FinClaw 评估、RLE 反馈、B 端数据交付或语料沉淀,但当前不进入第一阶段核心候选。它依赖 Perception Record、Data Quality / Provenance Metadata、evidence metadata、授权边界和版本 / manifest 机制;参考评估必须覆盖它。
6.2 Evidence Package
状态:reference candidate
候选级别:核心支撑候选对象
待评估问题:
- 单条感知对象如何保留原文、链接、时间、截图 / 快照、多源印证和处理链路?
- Evidence Package 与 Open API detail、raw news、source metadata 的关系如何定义?
当前对应:
当前已有 source_url、source_timestamp、raw content,但还没有 evidence package 对象。
已对齐口径:
Evidence Package 是 Data Horizon 的核心支撑候选对象,用于支撑 Perception Record 的可信度、可追溯和可复核。第一阶段可以先要求最小 evidence metadata,而不是承诺完整 evidence package;它是否成为独立输出对象,等待质量 / provenance 评估维度和参考评估后再决定。
6.3 Machine Feed Contract
状态:reference candidate
候选级别:接口面候选,不作为输出对象核心候选
待评估问题:
- Data Horizon 面向 FinClaw、AI Trading Matrix、RLE、FEFM 的机器 feed 是否应该分不同契约?
- feed 是 push、pull、streaming、bulk export,还是 MCP resource / tool?
- 如何确保 feed 不变成交易指令?
当前对应:
当前有 Open API、webhook、Trading Matrix 类 HTTP push、MCP API Key 鉴权,但没有正式机器 feed contract。
已对齐口径:
Machine Feed Contract 本质上是接口面候选,而不是底层输出对象。它消费的底层对象可能是 Perception Record 或 Financial Information Feed,后续应进入参考评估和协同边界对照,比较 REST、webhook、streaming、MCP、CLI、bulk export、dataset manifest 等形态。当前不作为输出对象核心候选,也不在当前阶段冻结接口设计。
6.4 Human Review / Quality Label Object
状态:reference candidate
候选级别:控制台工作流能力与质量元数据来源,暂非核心输出对象
待评估问题:
- 内部操作员如何标记重复、错误、低质量、疑似误导、授权风险、需要复核或高价值信息?
- 质量标签如何回流标准化、来源配置和成本路径?
当前对应:
当前有状态、错误和控制台,但未见稳定质量标注对象。
已对齐口径:
Human Review / Quality Label Object 先作为内部控制台工作流能力和 Data Quality / Provenance Metadata 的重要来源,用于复核、标注、纠错、质量反馈和来源调优。它应进入控制台工作流能力 inventory 和质量 / provenance 评估维度;当前不作为第一阶段核心输出对象。后续若建设数据质量服务或训练数据标注系统,再评估是否独立对象化。
6.5 Source Reliability Profile
状态:reference candidate
候选级别:质量 / provenance 评估维度中的候选问题域,暂非独立输出对象
待评估问题:
- 来源可信度是否属于 Data Horizon 当前阶段?
- 如果属于,应基于采集稳定性、重复率、错误率、授权、时效还是下游反馈?
- 如何避免把来源可靠性变成“预测准确率”或交易收益评价?
当前对应:
当前有 source 配置、KOL 关联、tags 和统计,但没有来源可靠性 profile。
已对齐口径:
Source Reliability Profile 暂不作为核心输出对象,也不作为独立产品对象。它先作为 quality / provenance 评估维度中的候选问题域,记录可观测、可解释、非交易化的来源质量问题,例如采集稳定性、重复率、失败率、延迟、授权状态、字段完整度和人工复核结果。第一阶段避免使用 PnL、交易表现或预测准确率定义来源可靠性。
其具体观测维度必须等待参考项目评估、当前实践画像补充和上位产品定义进一步收敛后再提出,不能以交易结果反向评价来源。
6.6 Retrieval Result / Search Result Object
状态:reference candidate
候选级别:检索能力与接口面候选,暂非核心输出对象
待评估问题:
- 检索结果对象应如何表达匹配原因、时间范围、来源、质量、语言和权限?
- 搜索、语义检索、过滤查询、MCP resource 查询是否应共用对象?
当前对应:
当前 Open API search 和 news-feed list 已有基础,但检索结果对象未显式定义。
已对齐口径:
Retrieval Result / Search Result Object 归入检索能力和接口面参考评估问题域,当前不作为核心输出对象。它消费 Perception Record、Financial Information Feed、质量 / provenance 元数据和 evidence metadata,不替代底层对象。当前 Open API search 只是初步材料;后续 reference evaluation 需要比较 keyword search、semantic search、filtered query、MCP resource 和 evidence retrieval 等形态。
7. 当前应避免对象
以下对象不应作为 Data Horizon 当前阶段正式输出对象:
-
交易指令
- 买入、卖出、开仓、平仓、调仓、下单。
-
确定性投资结论
- “应买入”“应卖出”“必然上涨”“可执行机会”。
-
执行触发器
- 可被下游系统直接当作交易动作触发的对象。
-
PnL 归因输出
- 以交易收益证明信息正确性的输出。
-
未授权非公开信息产品
- 缺少授权、来源和使用边界的信息对象。
-
模糊的“交易信号”
- 未说明只是感知对象、缺少质量和适用限制的 signal。
8. 输出对象初步分层
8.1 产品面对象
用于描述消费者和商业语境:
- 内部运营控制台信息流;
- 内部研究 / 复核信息流;
- 机器 feed;
- 数据集 / 语料库;
- 外部 B 端信息服务;
- 外部 C 端信息产品。
8.2 底层信息对象
用于复用和组合:
- Raw News Record;
- Standardized News Record;
- Perception Record;
- Source / Evidence Metadata;
- Evidence Package;
- Data Quality / Provenance Metadata;
- Category Metadata;
- Retrieval Result;
- Dataset Package;
- Push Log Entry。
8.3 运营对象
用于内部控制和观测:
- Crawler Source;
- Source Category;
- KOL Profile;
- Agent Configuration;
- Agent Execution Result;
- Subscriber;
- Direct Push Config;
- MCP API Key;
- LLM / Translate Usage Stats;
- Failure / Error Record。
9. 初始判断
当前实现最强的输出对象是:
- Raw News Record;
- Standardized News Record;
- Internal News Feed Item;
- Open News Item / Detail;
- Push Log Entry;
- Direct Push Payload;
- Agent Execution Result;
- LLM / Translate Usage Stats。
当前最需要挑战的对象是:
- Agent Execution Result;
- Trading Matrix 定向 payload;
- 旧 PRD 的 Standard Financial Event;
- 旧 PRD 的 Trading Signal;
- 旧 PRD 的 Deep Intelligence;
- 旧 PRD 的 RMF Attribution Report。
当前最值得进入 reference evaluation gate 的对象是:
- Perception Record;
- Financial Information Feed;
- Evidence Package;
- Data Quality / Provenance Metadata;
- Dataset Package;
- Machine Feed Contract;
- Human Review / Quality Label Object;
- Retrieval Result。
10. 下一步
在输出对象清单完成初版后,下一步应继续建立:
- Data Horizon 第三方参考项目筛选原则;
- 参考评估问题域,先服务参考项目筛选、实践画像对照和上位边界挑战,不展开字段、结构定义、接口或工程实施设计;
- 参考项目筛选、体验、测试、评估和交叉对比计划。
在这些清单完成前,不应冻结第一阶段最小输出对象。