FinBayes 意图识别与 LLM 策略 — 内部调研
这是什么
这份调研覆盖 FinBayes 在以下方向的业界实践、技术评估、设计取舍:
- 用户自然语言(含多模态)到结构化金融认知任务的识别机制
- LLM Function Calling 在金融场景的实际效果
- 缓存与规则在 LLM 应用中的角色
- 金融专用 LLM 现状与适用性
- 本地优先部署 + 用户自配置 Provider 的设计
- 多层劣化策略(云端 LLM 不可用时如何保持系统可用)
- 多模态输入预处理
调研为以下输出提供决策依据:
- ADR-004 任务识别策略 决策
- FinBayes 工程架构文档中的相关章节(系统全景的 Provider Adapter 子系统、横切关注点的边界与安全、可观测性等)
- 后续团队讨论与持续调研
与其他文档的关系
| 文档 | 关系 |
|---|---|
| 战略白皮书 | 上位约束(不变量、阶段范围、用户主权等) |
| 产品定义文档 | 上位约束(任务类型、输出认知要素、用户控制权等) |
FinBayes 工程架构(engineering/) | 本调研的发现入相关章节 |
| ADR-004 任务识别策略 | 本调研提供决策依据,ADR 是结论 |
当前架构重写工作流(governance/workstreams/finbayes-arch-rewrite/) | 当前工作流的产物之一,但调研本身作为项目级资产独立存在 |
章节结构
| 章节 | 主题 | 状态 |
|---|---|---|
summary.md | 研究总结与最重要的结论 | 草稿 |
01-agent-frameworks.md | 业界主流 Agent 项目(Claude Code / Hermes / OpenClaw 等)的意图识别 + 工具路由实践 | 待起草 |
02-llm-function-calling.md | 主流 LLM Function Calling 在金融意图识别的实效(BFCL / FinMCP-Bench 等数据) | 待起草 |
03-cache-and-rules.md | L3 缓存 + 规则路径业界实践(Siri / Alexa / 语义缓存系统) | 待起草 |
04-financial-specialized-llms.md | 金融专用 LLM 评估(XuanYuan / FinGPT / FinLLaMA 等) | 待起草 |
05-multi-tier-degradation.md | 多层劣化设计与业界离线方案对比 | 待起草 |
06-provider-configuration.md | 用户自配置 Provider 设计 | 待起草 |
07-multimodal-preprocessing.md | 多模态输入预处理(文件 / URL / 语音 / 表单) | 待起草 |
recommendations.md | 综合推荐方案(ADR-004 输入) | 草稿 |
09-open-questions.md | 已知风险 / 未决问题 / 持续调研方向 | 待起草 |
references.md | 所有引用源汇总 | 待起草 |
维护约定
- 每章节文档自包含可读,但有交叉引用(用章节标题,不用编号)
- 数据 / 结论需引用具体来源(在
references.md中汇总) - 持续调研产生新数据时更新对应章节,并在文档头
last-updated反映 - 与 ADR-004 决策冲突时,更新本调研对应章节并明示与 ADR 的关系