【速通RAG实战：数据库】6.RAG向量数据库原理

无心水

已于 2025-05-17 09:31:46 修改

阅读量1.1k

点赞数 24

CC 4.0 BY-SA版权

分类专栏：速通 RAG 实战！解锁 AI 2.0 高薪密码文章标签：速通RAG实战 RAG快速开发实战 RAG RAG向量数据库相似度 FAISS Chroma

于 2025-05-09 07:30:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/RickyIT/article/details/147774373

速通 RAG 实战！解锁 AI 2.0 高薪密码专栏收录该内容

25 篇文章 ¥19.90 ¥99.00

订阅专栏

在 RAG（检索增强生成）系统中，向量数据库扮演着至关重要的角色，它负责存储文本经过 Embedding 处理后的向量表示，并能高效地进行向量检索，以找出与查询向量最相似的文档。

1.向量数据库原理

1.向量表示

在 RAG 系统里，文本首先会通过 Embedding 模型（如 OpenAI Embeddings、Sentence Transformers 等）转化为固定维度的向量。这些向量能够捕捉文本的语义信息，使得语义相近的文本在向量空间中距离较近。例如，“苹果公司推出了新产品”和“苹果公司发布了新的产品”这两句话经过 Embedding 后，它们对应的向量在向量空间中的距离会比较小。

2.索引结构

为了实现高效的向量检索，向量数据库通常会采用特定的索引结构。常见的索引结构有：

KD - Tree（K - Dimensional Tree）
1. 原理：它是一种对 k 维空间中的点进行划分的数据结构，通过递归地将 k 维空间划分为两个半空间，从而实现对数据的快速查找。
2. 优点：实现相对简单，适用于低维数据（维度通常小于 20）。
3. 缺点：随着数据维度的增加，其查询效率会显著下降，出现“维度灾难”问题。
Ball Tree

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

无心水 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。