Financial Expert Foundation Model 当前状态
状态:基线收束草案 最后更新:2026-05-08 项目:Financial Expert Foundation Model 阶段:预启动 / 待定义能力议程、触发条件和样本治理边界
1. 本文档定位
本文档记录 Financial Expert Foundation Model 当前已经可确认的事实、事实等级、主要缺口、风险、开放问题和下一步。
它不替代:
-
project-anchor.md 项目定义、生态角色、职责边界、第一阶段目标和启动触发边界。
-
inherited-context.md 从生态级基线、项目注册表、金融风险和模型能力治理口径继承的上游上下文。
-
后续
CONTEXT.md、能力议程、协同边界记录、评估样本治理文档、PRD、实现计划、模型训练方案、模型微调方案或评测平台设计。
本文档的重点是回答:Financial Expert Foundation Model 目前已经站在哪里,距离可以被正式启动的金融领域模型能力底座还缺什么。
2. 当前状态摘要
当前可以确认:
Financial Expert Foundation Model已被生态层登记为两个基础设施 / 能力底座之一;- 当前生态定位是金融领域模型能力底座;
- 第一阶段目标不是全面训练或微调完整金融基础模型,而是定义正式启动前的触发条件、首阶段金融专家能力目标、与通用 LLM 的关系、所需真实任务与学习资产,以及评估样本治理方式;
- 当前项目级锚点和继承上下文已完成第一轮基线校准;
- 过本项目文档形成的关键生态理解是:FEFM 是把真实金融任务、经治理学习资产、评估样本和领域输出要求沉淀为长期金融领域模型能力的“长期能力壁垒层”。
当前仍未在本仓库登记清楚:
- 本地代码仓库目录;
- 当前是否已有模型、实验、脚本、数据集、评估样本、训练 / 微调配置或运行状态;
- 首阶段最先沉淀哪类金融专家能力;
- 与通用 LLM / 现有模型的关系和差异化路径;
- 哪些真实金融任务、反馈资产、评估样本、失败案例或结果标签足以触发模型能力建设;
- 哪些能力缺口必须由模型层解决,哪些应留在产品、技能、agent、数据链路或工作流层解决;
Reinforcement Learning Engine -> Financial Expert Foundation Model的学习资产沉淀边界;- 模型能力反哺
Data Horizon / 数据视界、FinClaw和AI Trading Matrix的验证方式。
因此,当前最核心的问题不是“是否要做模型”,而是:
如何把生态内真实金融任务、学习资产、评估样本和输出要求组织成可治理、可验证、可反哺的金融领域模型能力建设入口。
3. 当前已完成的文档状态
当前项目目录已有:
-
project-anchor.md 已校准为当前项目入口锚点。
-
inherited-context.md 已校准为上游继承上下文。
-
current-state.md 本文档,用于承接当前事实、缺口、风险、开放问题和下一步。
当前尚未建立:
CONTEXT.md- 首阶段金融专家能力议程
- 与通用 LLM / 现有模型的关系说明
Reinforcement Learning Engine -> Financial Expert Foundation Model学习资产沉淀说明- 评估样本治理规则
- 领域任务样本清单
- 失败案例 / 结果标签治理说明
- 模型能力反哺前台系统的验证说明
- 模型路线、训练路线、微调路线或评测平台设计
4. 当前已知进展
4.1 已确认进展
从当前仓库文档可以确认:
- 生态层已认可
Financial Expert Foundation Model的独立基础设施 / 能力底座身份; - 生态层已确认其角色是金融领域模型能力底座;
- 生态层已确认它不应替代前台产品定义、工作流设计或
Reinforcement Learning Engine的反馈学习治理职责; - 生态层已确认它不应在缺少真实任务、反馈资产、评估样本和样本治理时全面启动模型工程;
- 当前第一阶段应保持能力规划、触发条件、真实任务依赖、学习资产依赖和风险治理边界清晰;
- 当前候选能力对象包括
Financial Semantic Capability、Financial Reasoning Capability、Structured Output Capability、Long-context Synthesis Capability、Task Adaptation Capability、Tool-use / Workflow Capability和Evaluation Capability; - 当前候选接口包括
Reinforcement Learning Engine -> Financial Expert Foundation Model、Financial Expert Foundation Model -> FinClaw、Financial Expert Foundation Model -> Data Horizon / 数据视界和Financial Expert Foundation Model -> AI Trading Matrix。
4.2 待核验进展
旧状态文档保留的待核验判断:
- 当前已有启动前问题的初步工作框架;
- 当前模型层容易被理解成远期愿景而非可规划的基础设施项目;
- 与
Reinforcement Learning Engine和前台项目之间的边界、输入和支撑关系尚未正式收敛。
这些判断方向合理,但仍需要后续用真实任务清单、能力议程、样本对象、接口问题集、负责人说明、实验材料或实现证据补齐。
4.3 暂未登记事项
当前仓库尚未登记:
- FEFM 的本地仓库目录;
- FEFM 的原型、实验、脚本、数据集、模型配置、训练配置、微调配置或运行方式;
- 当前分支、版本、commit、部署环境或执行命令;
- 任何已落地的领域任务样本、评估样本、失败案例、结果标签或学习资产;
- 任一前台项目实际反哺到 FEFM 的模型能力改进需求;
- 学习资产进入模型能力建设链路前的来源、证据、权限、风险等级、审核状态和可学习范围字段;
- 与通用 LLM / 现有模型的能力分工;
- 模型能力反哺前台系统的验收标准。
本次轻量本地目录探测中,/Users/mlabs/Programs 下未发现明显匹配 foundation model、financial expert、fefm 或 fin model 的仓库路径。该结果只说明当前未发现明显本地目录,不等于项目不存在。
5. 第一阶段闭环当前判断
Financial Expert Foundation Model 是基础设施 / 能力底座,因此第一阶段不是独立产品闭环,而是“预启动能力议程与触发条件闭环”。
当前第一阶段至少需要补齐:
-
触发对象 哪个前台系统或 RLE 学习资产最先产生足够真实、可追溯、可治理的模型能力建设需求。
-
核心输入 第一阶段优先接收真实金融任务、领域任务样本、评估样本、失败案例、结果标签、学习资产,还是某几类组合。
-
能力议程 第一阶段最先沉淀金融语义理解、金融推理、结构化输出、长上下文整合、任务适配、工具 / 工作流能力,还是评估能力。
-
治理链路 如何完成样本来源记录、证据绑定、风险标记、审核状态记录、可学习范围定义、模型能力建设分流和反哺验证。
-
输出对象 第一阶段优先形成能力议程、评估样本集、任务样本清单、学习资产入模规则、模型能力缺口说明,还是前台反哺验证方案。
-
价值验证 如何证明模型能力建设能真实改进感知、认知、执行支持、结构化输出、工作流、技能、agent、模板或评估能力。
-
非目标和风险边界 如何避免空转式模型工程、泛化模型愿景、模型权威感误导、未经治理样本入模、绕过前台产品验证或绕过金融风险边界。
6. 当前主要缺口
6.1 事实缺口
- 本地代码仓库目录尚未登记;
- 当前是否已有模型、实验、脚本、数据集或运行状态尚未登记;
- 当前是否已有真实前台任务、RLE 学习资产或评估样本尚未登记;
- 当前领域任务样本、失败案例、结果标签和学习资产尚无样例;
- 当前可验证价值证据尚未整理。
6.2 能力议程缺口
- 首阶段金融专家能力目标尚未排序;
- 金融语义理解、金融推理、结构化输出、长上下文整合、任务适配、工具 / 工作流能力和评估能力之间的第一阶段优先级尚未定义;
- 哪些能力必须沉淀到模型层,哪些只需通过提示词、技能、agent、数据链路或产品工作流解决,尚未形成判断规则;
- 模型能力反哺前台系统的最低验证标准尚未定义;
- 能力建设结果如何进入生态共享事实源尚未定义。
6.3 启动条件缺口
- 正式启动的 readiness 条件尚未量化;
- “足够真实任务”和“足够治理样本”的最低标准尚未定义;
- 哪个前台项目或 RLE 学习资产最先触发 FEFM 尚未判断;
- 从任务样本、评估样本、失败案例到模型能力建设的阶段门槛尚未定义;
- 何时仍应保持预启动状态尚未形成判断规则。
6.4 学习资产与样本治理缺口
Learning Asset进入模型能力建设链路前的必填字段未定;- 评估样本、失败案例、结果标签和领域任务样本之间的关系未定;
- 哪些样本可用于模型能力评估,哪些可用于微调 / 训练候选,哪些只能用于工作流或提示词改进,尚未定义;
- 高风险、不可追溯、争议性、过时或来源不明样本的处理规则尚未定义;
- 样本失效、复核、回滚和删除机制尚未定义;
- 从 RLE 到 FEFM 的学习资产沉淀责任人和审核角色尚未定义。
6.5 接口缺口
Reinforcement Learning Engine -> Financial Expert Foundation Model的首个学习资产对象、样本类型和入模边界尚未定义;Financial Expert Foundation Model -> FinClaw的认知能力反哺验证方式尚未定义;Financial Expert Foundation Model -> Data Horizon / 数据视界的感知能力反哺验证方式尚未定义;Financial Expert Foundation Model -> AI Trading Matrix的交易执行支持能力反哺验证方式尚未定义;- 模型能力增强与前台产品本地改进之间的边界尚未正式固定。
6.6 通用 LLM 关系缺口
- 当前尚未定义 FEFM 与通用 LLM / 现有模型的关系;
- 何时使用通用 LLM、何时需要领域适配、何时需要评估样本治理、何时需要模型层能力建设尚未形成判断规则;
- FEFM 是否优先表现为提示词 / 技能 / agent / eval / sample governance,还是训练 / 微调 / 模型服务,尚未定;
- 通用模型能力升级对 FEFM 路线的影响尚未定义;
- 如何避免把通用 LLM 的短期能力提升误读为生态长期领域模型能力沉淀,尚未项目化。
7. 当前风险
-
空转式模型工程 如果在缺少真实任务、学习资产和评估样本前推进完整模型工程,FEFM 会偏离当前第一阶段判断,变成抽象模型愿景。
-
继续停留在战略占位 如果一直不定义能力议程、触发条件和样本治理,FEFM 会被反复提到,但无法真正承接长期模型能力建设。
-
模型权威感误导 如果模型输出被包装成确定性金融结论、收益保证或替用户承担投资责任的依据,会破坏金融风险边界。
-
与前台项目边界混淆 如果 FEFM 直接承担感知、认知、交易执行、交易执行支持或授权执行职责,会破坏
3 + 2结构和五层能力链路。 -
与 RLE 边界过早耦合 如果学习资产在缺少样本治理和模型路线时直接被写成训练 / 微调输入,会把 RLE 的反馈治理和 FEFM 的模型能力建设提前混合。
-
样本污染 如果未经核验、不可追溯、过时、高风险或带有强偏差的样本进入模型能力建设,后续能力可能强化错误金融理解和高风险行为。
-
通用 LLM 关系不清 如果不明确通用 LLM、提示词、技能、agent、工作流和模型能力建设的分工,FEFM 容易在“什么都算模型能力”和“什么都不用模型能力”之间摇摆。
-
反哺不可验证 如果不能证明模型能力增强如何改善
Data Horizon / 数据视界、FinClaw或AI Trading Matrix的具体任务,FEFM 的生态价值会停留在叙事层。
8. 当前最重要的下一步
-
定义首阶段金融专家能力议程 对七类候选能力排序,并说明每类能力对应哪些真实金融任务和前台反哺对象。
-
定义启动触发条件 把 readiness 条件拆成可检查清单,例如前台闭环、真实任务、治理样本、评估证据、风险标记和反哺责任。
-
定义与通用 LLM / 现有模型的关系 区分通用模型可直接解决、需要提示词 / 技能 / agent 解决、需要 eval / sample governance 解决,以及真正需要模型能力建设的场景。
-
定义 RLE 到 FEFM 的学习资产沉淀边界 先明确哪些学习资产只能停留在工作流级改进,哪些在治理成熟后可以作为模型能力输入候选。
-
定义第一版评估样本治理规则 从来源、证据、权限、风险等级、审核状态、可学习范围、失效条件和反哺对象开始。
-
选择首个反哺验证场景 当前可从
FinClaw的结构化认知输出、Data Horizon / 数据视界的信息抽取质量,或AI Trading Matrix的执行约束表达中选择,但需要真实任务证据决定。 -
判断是否建立
CONTEXT.md若金融专家能力、评估样本、学习资产、模型路线和治理术语已经足够多,应建立项目级CONTEXT.md。
9. 当前待决问题
- FEFM 是否已有本地代码仓库、实验目录、脚本、数据集、模型配置或运行环境?
- 第一阶段最先沉淀哪类金融专家能力:语义理解、研究推理、结构化输出、长上下文整合、任务适配、工具 / 工作流能力,还是评估能力?
- 当前最先可能触发 FEFM 的对象是
Reinforcement Learning Engine、FinClaw、Data Horizon / 数据视界,还是AI Trading Matrix? - 什么样的真实金融任务足以触发模型能力建设,而不是只触发产品、技能、agent、数据链路或工作流改进?
- 哪些学习资产可以进入模型能力建设链路,哪些只能停留在工作流级改进?
- 评估样本、失败案例、结果标签和领域任务样本的第一阶段最小字段是什么?
- 与通用 LLM / 现有模型的关系和差异化路径是什么?
- 模型能力反哺
FinClaw时,如何保留“认知 vs 执行”边界? - 模型能力反哺
AI Trading Matrix时,如何保留授权、审计、风控和可回滚治理边界? - 哪些能力一旦出现,就说明 FEFM 已经越过模型能力底座边界,开始承担前台产品、执行系统或反馈学习职责?
10. 何时需要向生态层回流
以下情况应触发 sync / escalation:
- 前台项目或 RLE 已提供足够真实任务、评估样本或学习资产,需要推动 FEFM 从预启动进入正式启动;
- 当前金融领域模型能力底座边界无法支持真实项目实践;
- 某些能力目标、领域任务样本、评估样本、失败案例或学习资产应上升为生态级共享定义;
Reinforcement Learning Engine -> Financial Expert Foundation Model学习资产对象无法用当前启动触发条件解释;Financial Expert Foundation Model -> FinClaw反哺设计冲击“认知 vs 执行”边界;Financial Expert Foundation Model -> Data Horizon / 数据视界反哺设计冲击感知 / 认知边界;Financial Expert Foundation Model -> AI Trading Matrix反哺设计冲击执行治理边界;- 项目触及真实执行反馈、资金 / 账户 / 链上动作反馈、用户责任边界或合规风险;
- 模型能力可能强化误导性、高风险、不可解释或未经治理的金融行为;
- 第一阶段能力议程、样本治理、模型路线或启动节奏发生根本变化。
11. 相关文档
- project-anchor.md
- inherited-context.md
- ../reinforcement-learning-engine/project-anchor.md
- ../reinforcement-learning-engine/inherited-context.md
- ../reinforcement-learning-engine/current-state.md
- ../../baseline/03-current-baseline.md
- ../../registry/project-registry.md
- ../../governance/first-phase-product-closure.md
- ../../governance/material-intake-policy.md
- ../../governance/project-context-template.md