跳到主要内容

DH-WP-001 S1 信源画像交接与回填契约(DH ↔ Trading Matrix)

0. 文档元信息

说明
面向Trading Matrix(TM)
用途界定 DH 信源动态画像中谁填什么字段、按什么接口、什么口径标准,及 TM 绩效回填协议
配套字段全集与质量规则见 S1 信源画像与质量初评规则
成熟度proposal-v0.1:接口细节与口径需 DH↔TM 双方确认后冻结,非单方固化

定位:DH(感知层)产出"信息源输入质量画像 + 结构化信号";TM(执行/验证层)消费,并把绩效回测结果回填 DH。 红线:DH 评信息源输入质量,TM 评策略验证表现,两套分数分离


1. 字段归属总表(谁完成)

画像分组内容完成方备注
A 身份与静态分类/市场/语言/商业引流标DH派生
B 方法与风格周期/派系/多空/对冲/风险披露/信心DH(NLP)带置信
C 信号结构逐消息 标的/方向/入场/止损/止盈 齐备率、可解析等级、点位 vs 区间DHTM 回测输入
D 活跃与节奏频次/延迟/活跃窗DH(数据)
E 输入质量质量档 A/B/C/D + 子项DH非绩效
F 自报声明自报战绩(unverified)/营销强度DH不可作真值
G 绩效胜率/滚动胜率/盈亏比/回撤/已实现漂移/期望值TM 回填本文重点
H 治理置信/证据/版本/复核DH

2. DH 交付给 TM(读取侧)

2.1 信源画像(只读)

  • 表/视图 dn_source_profile(serving) ⟕ metrics ⟕ override;TM 只读。
  • join 键 = 裸 source_id bigint(= dn_crawler_source.id,与 TM tm_event_signal.source_id 一致);cs_{id} 仅展示。
  • 时间一律 Unix epoch UTC;延迟 毫秒整数。(DH 内部 datetime 存 UTC+8,已在 API 边界统一转 Unix-UTC。)

2.2 结构化信号(TM 回测输入,核心)

  • dn_source_signal(逐消息 ex-ante 抽取)。只交 msg_kind='trade_intent'(事前信号),不含 ex-post 成交回报(Realized R/R、PnL 属 TM 自算)。
  • 每行:raw_news_id(证据锚) · source_id · symbol · direction(long/short) · entry(point 或 zone{min,max}) · stop · target[] · levels_style(exact_point/zone) · signal_clarity · parseability · published_ts(Unix UTC) · capture_latency_ms。缺失要素 null。

2.3 访问方式(提案)

  • 批量/历史:只读查询网关(query-nest/Aven)或 DH 导出。
  • 增量:DH 开放 GET /v1/open/profile/signals?source_ids=&since_id=(游标,复用 Open API + X-API-Key)。待确认

3. TM 回填给 DH(写入侧,Group G)

3.1 协议(提案)

  • TM → DH 写回 API(对齐 DH-WP-001「POST /dh/trading-matrix-feedback」与"走 API"约定)。
  • 端点(提案):POST /v1/open/profile/perf-feedback,Header X-API-Key
  • 落库:dn_source_perf(TM 独写、DH 只读,与 DH 的 A–F 重算无写竞争)。
  • 幂等:按 (source_id, backtest_window) upsert。

3.2 请求体(提案)

{
"source_id": 107,
"backtest_window": "2025-12-01..2026-06-01",
"as_of": 1781000000,
"signal_basis": "dn_source_signal:trade_intent",
"historical_win_rate": 0.58,
"rolling_win_rate_7d": 0.61,
"profit_factor": 1.74,
"max_drawdown": 0.23,
"realized_style_drift": 0.12,
"expectancy": 0.35,
"sample_trade_count": 412,
"notes": "..."
}

3.3 Group G 口径标准(TM 计算,DH 仅存储展示)

字段类型/范围定义标准单位
historical_win_rate0..1已平仓盈利笔数 / 总平仓笔数,覆盖 backtest_window比例
rolling_win_rate_7d0..1近 7 天滚动胜率比例
profit_factor≥0总盈利 / 总亏损(>1 为正期望)
max_drawdown0..1该源信号驱动模拟资金曲线最大回撤率比例
realized_style_drift0..1已实现风格漂移(需成交序列,故归 TM;区别于 DH 的 text_self_consistency)指数
expectancyfloat每笔期望收益(R 或 %,注明)R/%
sample_trade_countint参与统计的模拟成交笔数(<阈值标低置信)
backtest_window / as_ofstr/Unix回测区间 / 计算时点

3.4 信号 → 模拟成交映射标准(TM 侧)

  • TM 以 DH dn_source_signal(trade_intent) 为信号源,按 symbol/direction/entry(point|zone)/stop/target 在 backtest_window 行情上模拟开平仓。
  • 入场:市价在 entry 成交(zone 用区间,point 用触发);出场:止损/止盈/反向信号;无止损信号按 TM 默认风控(须在 notes 注明,因 DH 已标 gives_stop_loss)。
  • 一笔 trade = 一次开→平;胜 = 平仓收益>0;R = 收益 / 初始风险(|entry−stop|)。

4. 双向一致性约定

  • 单位:时间 Unix-UTC;延迟 ms;比率 0..1;价格原始计价。
  • 版本:DH 画像带 profile_version;TM 回填带 backtest_window+as_of;展示时并列"画像版本 / 绩效截至",不混淆两套分数。
  • 自报战绩(F):DH 传 self_reported{unverified:true},TM 不得与回测 G 混用。
  • 数据不足源(data_sufficiency∈{limited,dormant,no_data})→ TM 可跳过回测,G 留空。

5. 待 DH ↔ TM 确认(开放项)

  1. 读取侧增量接口形态(游标 API vs 查询网关 vs 导出)。
  2. 写回端点路径/鉴权/配额;是否需 per-signal 级回测明细(而非仅 source 级汇总)。
  3. realized_style_drift / expectancy 的精确公式与 R 定义统一。
  4. 无止损信号的回测默认处理。
  5. 枚举对齐:DH 新增 COMMUNITY、method_tags(on_chain/wyckoff/quant)、levels_style、trade_structure,TM 侧消费枚举需同步。
  6. 刷新节奏对齐:DH 画像刷新周期 vs TM 回测回填周期。