526互联

使用LOTR合并检索提高RAG性能

发布时间 2023-12-30 09:50:02作者: deephub

RAG结合了两个关键元素:检索和生成。它首先使用语义搜索等高级技术来浏览大量数据，包括文本、图像、音频和视频。RAG的本质在于它能够检索相关信息，然后作为下一阶段的基础。生成组件利用大型语言模型的能力，解释这些数据块，制作连贯的、类似人类的响应。与传统的生成模型相比，这个过程确保RAG系统可以提供更细致和准确的输出。

Lost in the Middle”

在RAG中“LIM”问题相当具有挑战性。斯坦福大学和加州大学伯克利分校等大学的研究强调了这一问题，这与人们经常记住购物清单上的第一个和最后一个项目，但忘记中间的项目类似。语言模型人一样很擅长识别他们正在分析的文本的开头或结尾的信息，但他们往往会忽略中心的关键细节。

为了解决这个问题，我们一般都是用下面的方法：

1、避免使用单一知识库，对不同类型的文档只使用一个知识库可能会混淆检索模型。他们可能很难根据主题或上下文找到正确的信息。

2、使用多个矢量存储，为不同类型的文档创建单独的数据存储区域(称为矢量存储)。这有助于更有效地组织信息。

3、使用一个称为Merge retriver的工具合并来自这些不同VectorStores的数据。这有助于汇集来自不同来源的相关信息。

4、使用长上下文重新排序(LOTR)重新排序，这确保了模型对文本中间的数据给予同等的关注，而不仅仅是在开头或结尾。

通过使用上面这些技术，可以确保数据的所有部分(包括中间部分)都得到了适当的检索并用于生成响应。这些步骤有助于改进RAG系统的性能，使它们更有效地处理和解释大量不同的信息源。

https://avoid.overfit.cn/post/d252399e19e5409abf9990591523c11f

知识库知识rag

funtioncalling rag模型

实战langchain文档rag

图谱知识graph rag

原理传统rag llm

简介kernel memory rag