【深度学习】检索增强生成 RAG

藓类少女

已于 2024-12-02 18:30:05 修改

阅读量898

点赞数 11

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签：深度学习人工智能

于 2024-12-02 18:16:06 首次发布

RAG (Retrieval-Augmented Generation) 是由 Facebook AI Research (FAIR) 提出的。具体来说，RAG 是在 2020 年的论文 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks 中首次被提出的。

在 NLP 中，有很多知识密集型任务（Knowledge-Intensive Tasks），如开放领域问答、知识生成等，这些任务依赖于模型掌握大量的外部知识。然而，传统的预训练生成模型（如 GPT-3、BERT）存在以下问题：

RAG 的目标 是解决这些问题，通过引入一个外部知识库来增强生成模型的知识能力，同时使得模型更灵活和可扩展。

传统生成模型（如 GPT、BERT）在回答问题时依赖于预训练数据的记忆，而 RAG 提供了一种动态查询外部知识库的能力。具体而言：

这种设计使 RAG 能够动态获取外部知识，解决生成模型对训练数据依赖的问题。

输入问题：
用户提供一个查询（Query），例如“Who won the Nobel Prize in Physics in 2023?”
检索阶段（Retrieval）：
- 使用基于嵌入的检索模型（如 SentenceTransformer、BM25、Dense Retriever）从知识库中挑选最相关的文档。
- 知识库的内容通常被预处理为嵌入向量，存储在向量数据库（如 FAISS）中。
- 输出是检索到的文档集合（例如 5 个文档）。
生成阶段（Generation）：
- 将检索到的文档与查询合并，作为上下文输入到生成模型中（如 BART、GPT）。
- 模型基于上下文生成答案。
输出答案：
最终生成的答案由生成模型直接输出。