一、前言
在构建RAG系统时,文本分块的粒度选择常面临两难:过小的片段虽提升语义匹配精度,却易丢失关键上下文;过大的块虽保留完整信息,但会降低检索相关性。这种\"上下文割裂\"问题直接影响问答质量。
LangChain的ParentDocumentRetriever通过分层处理策略破解此困局。其核心是将文档拆解为两级结构:先用子文档进行高精度向量检索,再关联到父文档提供完整上下文。这种设计在保障检索准确性的同时,有效解决了传统方案中信息碎片化的问题。
相关文章:
开源模型应用落地-RAG优化小技巧-用MultiQueryRetriever解锁信息检索的多维视角(一)