一个基本的 RAG (Retrieval-Augmented Generation) 管道通常止步于向量相似度搜索。实践中,这种方案返回的上下文质量常常参差不齐,导致大语言模型 (LLM) 的生成结果偏离预期,甚至产生幻觉。单纯依赖 top
2023-11-15