第 9 章：RAG 管道高级优化

3.4K 00

文章目录

Dify的RAG 管道高级优化

在 RAG 应用中，最常见的抱怨是：“AI 找不到我文档里的内容”。本章将带你深入底层，通过混合检索、重排序和查询改写，大幅提升检索精度。

传统的 RAG 只依赖向量检索（Vector Search），容易在关键词匹配上失灵。Dify 的进阶优化方案是：

优化手段	原理	优势
混合检索 (Hybrid Search)	结合向量检索（语义）和全文检索（关键词）。	兼顾语义理解和精准匹配，不再错过专有名词。
重排序 (Rerank)	检索出 Top 50 个片段后，用 Rerank 模型重新计算它们与问题的相关性，取前 3-5 个。	过滤掉“看起来像但其实无关”的片段，极大提升准确度。

分块 (Chunking) 策略：
- Overlap (重叠度)：在两个分块之间保留 10%-20% 的重叠，防止核心语义在断句处丢失。
- 语义分块：使用 LLM 识别段落边界，按逻辑分块而非固定长度。
元数据 (Metadata) 增强：
- 为每个分块添加“文件名”、“章节标题”、“关键词”等标签。
- 检索时可以利用元数据进行过滤（如：只在“2026年报告”这个分类下检索）。

查询重写 (Query Rewriting)：
- 使用 LLM 将用户的模糊提问改写为更适合检索的专业术语。
- 例如：用户问“怎么用这个？”，LLM 改写为“Dify 平台本地部署及应用编排的详细操作步骤”。
多查询生成 (Multi-Query)：
- 针对用户的一个问题，生成 3 个不同侧重点的提问，分别检索后再汇总结果。

下一章预告：我们将进入最后的实战阶段，学习如何进行企业级部署与运维，并分享几个综合实战案例。