> 技术文档 > RAG vs 微调

RAG vs 微调


一、知识

RAG:问题  ——>   LLM + 外部知识 (拼接)——> 回复

目的:不修改模型参数,为了 增强检索、更准确的回答问题

微调:基础 LLM  + 知识 (融合) ——>  LLM(更完善的大模型)

目的:训练调整模型参数,提升模型能力

二、特性对比

  • RAG: 处理事实类查询

  • 模型微调: 处理 复杂分析/评估/预测/推理类任务

特性 RAG 模型微调 知识更新 实时(分钟级) 需重新训练(天/周级) 可解释性 高(提供来源) 低(黑盒决策) 领域适应性 更换知识库即可 需重新训练 处理复杂推理 中等 优秀 银行适用场景 制度问答、操作指南 风险评估、财务预测

三、选择RAG还是微调的九个判断依据?

  1. 实时或动态变化的数据:RAG
  2. 遵循事实、更低的幻觉:RAG
  3. 可解释性、可追溯来源:RAG (微调是黑盒)
  4. 更高数据隐私性:RAG
  5. 依赖通用能力:RAG
  6. 低成本、低门槛:RAG
  7. 模型能力定制:微调
  8. 智能设备:微调
  9. 更低延迟:微调