跳到主要内容

DH-WP-001 Trading Matrix 信源候选与样本交付任务包设计

本文把 Trading Matrix 提出的 Data Horizon 信源候选与样本交付任务书 转成 Data Horizon 侧第一优先级任务包。

任务包编号:DH-WP-001

当前状态:Ready for S0

第一目标:先交付一批可追溯、可去重、可抽样、可由 Trading Matrix 生成策略种子的信源候选与信号样本。

0. 本任务包目录

DH-WP-001 采用独立子目录管理。任务包设计、S0 字段字典、S0 交付说明、Trading Matrix 试消费反馈、S1/S2 复盘记录,后续都放在本目录下。

当前目录首页承担任务包设计卡作用。后续建议按触发条件逐步补充:

文档状态文件
S0 baseline 字段字典已创建S0 baseline 字段字典
S0 baseline 交付说明已创建S0 baseline 交付说明
Trading Matrix 试消费反馈记录已创建(待 TM 填写)Trading Matrix 试消费反馈记录
S1 画像与质量初评规则S0 baseline 被确认可继续试验。s1-source-profile-quality-rules.md
S2 动态服务与 Dashboard 说明需要从静态交付进入动态服务。s2-dashboard-api-design.md

1. 为什么现在做

这个任务来自 Trading Matrix 的明确协同需求,并且能验证 Data Horizon 第一阶段最核心的纵向链路:

它能同时暴露以下问题:

  • Data Horizon 当前是否有稳定的信源 ID、样本 ID 和原始记录引用;
  • 样本是否能保留发布时间、捕获时间、入库时间,避免时间语义混淆;
  • KOL / 分析师 / 频道是否能形成可复核的来源画像和质量初评;
  • Trading Matrix 是否能基于 DH 交付物生成策略种子;
  • 下游验证结果是否能回写为 DH 的运行证据资产。

2. 目标用户与协同对象

角色使用方式
Data Horizon 运营人员登记、复核、标记、推荐信源和样本。
Data Horizon 执行 Agent汇总候选、抽样、标注字段、生成画像、初评质量。
Trading Matrix 团队消费候选包,生成策略种子,回写验证状态。
生态管理者 / 业务负责人查看该闭环是否能证明 DH 到 Trading Matrix 的第一阶段协同价值。

3. 范围

3.1 本任务包要做

  • 建立第一批职业交易员 / 分析师 / 频道 / 社群等候选信源清单;
  • 给候选信源分配或确认稳定 source_id
  • 为候选信源抽取历史样本和近期样本;
  • 保留 raw_ref、原始内容或可审计摘要、发布时间、捕获时间和入库时间;
  • 标记标的、方向、周期、入场线索、退出线索、风险提示和可解析状态;
  • 形成信源画像、动态标签、质量初评和推荐理由;
  • 输出 Trading Matrix 可消费的 baseline 文件、定时导出或内部接口候选;
  • 接收或预留 Trading Matrix 反馈字段。

3.2 本任务包暂不做

  • 不做 Trading Matrix 的回测、模拟、实盘、赛马或收益表现判断;
  • 不把 DH 的信息源质量初评解释为交易能力评分;
  • 不在 S0 阶段直接建设完整业务运营后台;
  • 不把无法追溯来源、缺少原始记录或时间戳的数据放入优先验证列表;
  • 不把私域 / KOL 信息的授权与限制问题留到输出后再处理。

4. 阶段与交付物

阶段目标DH 交付Trading Matrix 动作状态
S0 baseline快速跑通第一批静态交付。信源候选 CSV / JSON,代表样本 CSV / JSON,字段说明。检查是否足够生成策略种子。Ready
S1 初评分类给候选信源和样本形成初评优先级。信源画像、质量标记、A/B/C/D 初评和推荐理由。选择第一批进入策略种子和回测设计。Pending
S2 动态服务从一次性交付升级为可刷新能力。DH 管理后台列表、详情、筛选、导出或 API。建立定期拉取和反馈回写。Pending
S3 持续刷新形成长期更新和反馈闭环。新增信源、样本增量、画像变化、质量复核。回写验证、赛马和资产状态。Later

5. 最小字段口径

5.1 信源字段

字段说明S0 是否必需
source_idDH 生成或确认的稳定信源 ID。必需
source_type职业交易员、分析师、频道、新闻源、链上源、其他。必需
display_name展示名称。必需
channel来源渠道。必需
external_ref原始账号、频道、链接或内部引用。必需
market_scope主要市场和标的范围。建议
signal_style信号风格或内容风格。建议
active_status活跃、低活跃、待复核、暂停、淘汰。必需
dh_quality_gradeA、B、C、D 初评等级。S1 必需
dh_quality_reason初评理由。S1 必需
last_sample_at最近样本发布时间。建议
created_at信源登记时间。必需
updated_at最近更新时间。必需

5.2 样本字段

字段说明S0 是否必需
sample_idDH 生成或确认的稳定样本 ID。必需
source_id所属信源。必需
raw_ref原始记录、链接、截图或内部对象引用。必需
raw_content原始内容或可审计摘要。必需
published_at原始发布时间。必需
captured_atDH 捕获时间。必需
ingested_at入库或交接时间。必需
symbols涉及标的。建议
direction多、空、观望、风险提示、未知。建议
time_horizon日内、短线、波段、中长期、未知。建议
entry_hint入场线索。建议
exit_hint退出线索。建议
risk_hint风险提示。建议
parse_status可解析、需人工复核、不可解析。必需
quality_flags重复、过期、缺字段、截图难解析、噪声等。建议

5.3 Trading Matrix 反馈字段

字段说明首次落法
tm_seed_status是否已生成策略种子。S0 可空,S1/S2 回写
tm_validation_status是否进入回测、模拟或小资金实盘。S1/S2 回写
tm_asset_status观察、失败、暂停、核心策略候选等状态。S2/S3 回写
tm_feedback_reasonTrading Matrix 的反馈理由。S1/S2 回写
tm_last_feedback_at最近反馈时间。S1/S2 回写

6. S0 启动动作

S0 不先做完整系统,而是先用一批真实数据验证字段和交接流程。

动作目标产出
工程仓事实核对确认当前是否已有 source、KOL、raw record、sample、push 或 execution evidence 可复用。当前能力核对记录。
数据库抽样确认已有数据是否能支撑 source_idsample_idraw_ref 和三类时间字段。样本数据可用性记录。
S0 字段冻结明确第一版 CSV / JSON 的必填字段和可空字段。S0 baseline 字段字典。
候选信源导出输出第一批去重信源候选。sources_baseline
代表样本导出输出每个优先候选的代表样本。samples_baseline
Trading Matrix 试消费验证字段是否足够生成策略种子。消费反馈和字段修正意见。

7. 业务运营 Dashboard 要求

业务运营 Dashboard 不作为 S0 前置条件,但应进入 S2 动态服务阶段。

第一版应至少包含:

视图需要回答的问题
信源候选列表当前有哪些候选,状态是什么,为什么被追踪,是否优先验证。
信源详情这个信源的来源、画像、活跃状态、样本、质量初评和限制是什么。
样本列表哪些样本可解析、需复核、不可解析,是否有原始回链。
推荐队列哪些信源和样本准备交给 Trading Matrix,理由是什么。
反馈视图Trading Matrix 是否生成策略种子,是否进入验证,反馈原因是什么。
审计视图谁修改了标签、等级、状态和推荐理由。

8. 验收标准

S0 baseline 完成时:

  • 至少有一批可追溯、已去重、带状态的信源候选;
  • 每个优先验证信源至少有代表样本;
  • 每条样本都能追溯到 source_idraw_ref
  • 样本保留发布时间、捕获时间和入库时间,三者不混淆;
  • 样本能区分可解析、需人工复核和不可解析;
  • 无来源不明、无法追溯、无时间戳的数据进入优先验证列表;
  • Trading Matrix 能基于 S0 交付物判断是否足够生成策略种子。

S1/S2 完成时:

  • 每个优先验证信源有画像、质量初评等级和样本证据;
  • DH 初评只表达输入质量和验证价值,不表达收益能力;
  • Trading Matrix 可以回写策略种子、验证状态、资产状态和反馈理由;
  • DH 侧能查看反馈,并把反馈作为后续来源和样本质量判断的证据。

9. 待确认问题

以下问题不阻塞 S0,但需要在 S1 或 S2 前确认:

  • 第一批 baseline 的样本时间窗口和每个信源样本量;
  • 当前 DH 是否已有稳定 source_idsample_id,还是需要新建映射;
  • 私域 / KOL 来源是否存在访问权限、引用限制或隐私限制;
  • Trading Matrix 反馈回写先用文件、人工复核队列还是 API;
  • A/B/C/D 初评等级的默认阈值;
  • DH 管理后台是否已有适合承载 S2 视图的页面。

Changelog / 演化记录

2026-05-27:产出 S0 字段字典、交付说明与试消费反馈记录(schema dh-wp-001-s0-v1)。 2026-05-26:将 DH-WP-001 调整为独立任务包目录,并补充本目录后续文档产出规则。 2026-05-26:创建 DH-WP-001 任务包设计卡,将 Trading Matrix 信源候选与样本交付请求转成 Data Horizon 第一优先级实施任务。