DH-WP-001 Trading Matrix 信源候选与样本交付任务包设计
本文把 Trading Matrix 提出的 Data Horizon 信源候选与样本交付任务书 转成 Data Horizon 侧第一优先级任务包。
任务包编号:DH-WP-001
当前状态:Ready for S0
第一目标:先交付一批可追溯、可去重、可抽样、可由 Trading Matrix 生成策略种子的信源候选与信号样本。
0. 本任务包目录
DH-WP-001 采用独立子目录管理。任务包设计、S0 字段字典、S0 交付说明、Trading Matrix 试消费反馈、S1/S2 复盘记录,后续都放在本目录下。
当前目录首页承担任务包设计卡作用。后续建议按触发条件逐步补充:
| 文档 | 状态 | 文件 |
|---|---|---|
| S0 baseline 字段字典 | 已创建 | S0 baseline 字段字典 |
| S0 baseline 交付说明 | 已创建 | S0 baseline 交付说明 |
| Trading Matrix 试消费反馈记录 | 已创建(待 TM 填写) | Trading Matrix 试消费反馈记录 |
| S1 画像与质量初评规则 | S0 baseline 被确认可继续试验。 | s1-source-profile-quality-rules.md |
| S2 动态服务与 Dashboard 说明 | 需要从静态交付进入动态服务。 | s2-dashboard-api-design.md |
1. 为什么现在做
这个任务来自 Trading Matrix 的明确协同需求,并且能验证 Data Horizon 第一阶段最核心的纵向链路:
它能同时暴露以下问题:
- Data Horizon 当前是否有稳定的信源 ID、样本 ID 和原始记录引用;
- 样本是否能保留发布时间、捕获时间、入库时间,避免时间语义混淆;
- KOL / 分析师 / 频道是否能形成可复核的来源画像和质量初评;
- Trading Matrix 是否能基于 DH 交付物生成策略种子;
- 下游验证结果是否能回写为 DH 的运行证据资产。
2. 目标用户与协同对象
| 角色 | 使用方式 |
|---|---|
| Data Horizon 运营人员 | 登记、复核、标记、推荐信源和样本。 |
| Data Horizon 执行 Agent | 汇总候选、抽样、标注字段、生成画像、初评质量。 |
| Trading Matrix 团队 | 消费候选包,生成策略种子,回写验证状态。 |
| 生态管理者 / 业务负责人 | 查看该闭环是否能证明 DH 到 Trading Matrix 的第一阶段协同价值。 |
3. 范围
3.1 本任务包要做
- 建立第一批职业交易员 / 分析师 / 频道 / 社群等候选信源清单;
- 给候选信源分配或确认稳定
source_id; - 为候选信源抽取历史样本和近期样本;
- 保留
raw_ref、原始内容或可审计摘要、发布时间、捕获时间和入库时间; - 标记标的、方向、周期、入场线索、退出线索、风险提示和可解析状态;
- 形成信源画像、动态标签、质量初评和推荐理由;
- 输出 Trading Matrix 可消费的 baseline 文件、定时导出或内部接口候选;
- 接收或预留 Trading Matrix 反馈字段。
3.2 本任务包暂不做
- 不做 Trading Matrix 的回测、模拟、实盘、赛马或收益表现判断;
- 不把 DH 的信息源质量初评解释为交易能力评分;
- 不在 S0 阶段直接建设完整业务运营后台;
- 不把无法追溯来源、缺少原始记录或时间戳的数据放入优先验证列表;
- 不把私域 / KOL 信息的授权与限制问题留到输出后再处理。
4. 阶段与交付物
| 阶段 | 目标 | DH 交付 | Trading Matrix 动作 | 状态 |
|---|---|---|---|---|
| S0 baseline | 快速跑通第一批静态交付。 | 信源候选 CSV / JSON,代表样本 CSV / JSON,字段说明。 | 检查是否足够生成策略种子。 | Ready |
| S1 初评分类 | 给候选信源和样本形成初评优先级。 | 信源画像、质量标记、A/B/C/D 初评和推荐理由。 | 选择第一批进入策略种子和回测设计。 | Pending |
| S2 动态服务 | 从一次性交付升级为可刷新能力。 | DH 管理后台列表、详情、筛选、导出或 API。 | 建立定期拉取和反馈回写。 | Pending |
| S3 持续刷新 | 形成长期更新和反馈闭环。 | 新增信源、样本增量、画像变化、质量复核。 | 回写验证、赛马和资产状态。 | Later |
5. 最小字段口径
5.1 信源字段
| 字段 | 说明 | S0 是否必需 |
|---|---|---|
source_id | DH 生成或确认的稳定信源 ID。 | 必需 |
source_type | 职业交易员、分析师、频道、新闻源、链上源、其他。 | 必需 |
display_name | 展示名称。 | 必需 |
channel | 来源渠道。 | 必需 |
external_ref | 原始账号、频道、链接或内部引用。 | 必需 |
market_scope | 主要市场和标的范围。 | 建议 |
signal_style | 信号风格或内容风格。 | 建议 |
active_status | 活跃、低活跃、待复核、暂停、淘汰。 | 必需 |
dh_quality_grade | A、B、C、D 初评等级。 | S1 必需 |
dh_quality_reason | 初评理由。 | S1 必需 |
last_sample_at | 最近样本发布时间。 | 建议 |
created_at | 信源登记时间。 | 必需 |
updated_at | 最近更新时间。 | 必需 |
5.2 样本字段
| 字段 | 说明 | S0 是否必需 |
|---|---|---|
sample_id | DH 生成或确认的稳定样本 ID。 | 必需 |
source_id | 所属信源。 | 必需 |
raw_ref | 原始记录、链接、截图或内部对象引用。 | 必需 |
raw_content | 原始内容或可审计摘要。 | 必需 |
published_at | 原始发布时间。 | 必需 |
captured_at | DH 捕获时间。 | 必需 |
ingested_at | 入库或交接时间。 | 必需 |
symbols | 涉及标的。 | 建议 |
direction | 多、空、观望、风险提示、未知。 | 建议 |
time_horizon | 日内、短线、波段、中长期、未知。 | 建议 |
entry_hint | 入场线索。 | 建议 |
exit_hint | 退出线索。 | 建议 |
risk_hint | 风险提示。 | 建议 |
parse_status | 可解析、需人工复核、不可解析。 | 必需 |
quality_flags | 重复、过期、缺字段、截图难解析、噪声等。 | 建议 |
5.3 Trading Matrix 反馈字段
| 字段 | 说明 | 首次落法 |
|---|---|---|
tm_seed_status | 是否已生成策略种子。 | S0 可空,S1/S2 回写 |
tm_validation_status | 是否进入回测、模拟或小资金实盘。 | S1/S2 回写 |
tm_asset_status | 观察、失败、暂停、核心策略候选等状态。 | S2/S3 回写 |
tm_feedback_reason | Trading Matrix 的反馈理由。 | S1/S2 回写 |
tm_last_feedback_at | 最近反馈时间。 | S1/S2 回写 |
6. S0 启动动作
S0 不先做完整系统,而是先用一批真实数据验证字段和交接流程。
| 动作 | 目标 | 产出 |
|---|---|---|
| 工程仓事实核对 | 确认当前是否已有 source、KOL、raw record、sample、push 或 execution evidence 可复用。 | 当前能力核对记录。 |
| 数据库抽样 | 确认已有数据是否能支撑 source_id、sample_id、raw_ref 和三类时间字段。 | 样本数据可用性记录。 |
| S0 字段冻结 | 明确第一版 CSV / JSON 的必填字段和可空字段。 | S0 baseline 字段字典。 |
| 候选信源导出 | 输出第一批去重信源候选。 | sources_baseline。 |
| 代表样本导出 | 输出每个优先候选的代表样本。 | samples_baseline。 |
| Trading Matrix 试消费 | 验证字段是否足够生成策略种子。 | 消费反馈和字段修正意见。 |
7. 业务运营 Dashboard 要求
业务运营 Dashboard 不作为 S0 前置条件,但应进入 S2 动态服务阶段。
第一版应至少包含:
| 视图 | 需要回答的问题 |
|---|---|
| 信源候选列表 | 当前有哪些候选,状态是什么,为什么被追踪,是否优先验证。 |
| 信源详情 | 这个信源的来源、画像、活跃状态、样本、质量初评和限制是什么。 |
| 样本列表 | 哪些样本可解析、需复核、不可解析,是否有原始回链。 |
| 推荐队列 | 哪些信源和样本准备交给 Trading Matrix,理由是什么。 |
| 反馈视图 | Trading Matrix 是否生成策略种子,是否进入验证,反馈原因是什么。 |
| 审计视图 | 谁修改了标签、等级、状态和推荐理由。 |
8. 验收标准
S0 baseline 完成时:
- 至少有一批可追溯、已去重、带状态的信源候选;
- 每个优先验证信源至少有代表样本;
- 每条样本都能追溯到
source_id和raw_ref; - 样本保留发布时间、捕获时间和入库时间,三者不混淆;
- 样本能区分可解析、需人工复核和不可解析;
- 无来源不明、无法追溯、无时间戳的数据进入优先验证列表;
- Trading Matrix 能基于 S0 交付物判断是否足够生成策略种子。
S1/S2 完成时:
- 每个优先验证信源有画像、质量初评等级和样本证据;
- DH 初评只表达输入质量和验证价值,不表达收益能力;
- Trading Matrix 可以回写策略种子、验证状态、资产状态和反馈理由;
- DH 侧能查看反馈,并把反馈作为后续来源和样本质量判断的证据。
9. 待确认问题
以下问题不阻塞 S0,但需要在 S1 或 S2 前确认:
- 第一批 baseline 的样本时间窗口和每个信源样本量;
- 当前 DH 是否已有稳定
source_id和sample_id,还是需要新建映射; - 私域 / KOL 来源是否存在访问权限、引用限制或隐私限制;
- Trading Matrix 反馈回写先用文件、人工复核队列还是 API;
- A/B/C/D 初评等级的默认阈值;
- DH 管理后台是否已有适合承载 S2 视图的页面。
Changelog / 演化记录
2026-05-27:产出 S0 字段字典、交付说明与试消费反馈记录(schema dh-wp-001-s0-v1)。
2026-05-26:将 DH-WP-001 调整为独立任务包目录,并补充本目录后续文档产出规则。
2026-05-26:创建 DH-WP-001 任务包设计卡,将 Trading Matrix 信源候选与样本交付请求转成 Data Horizon 第一优先级实施任务。