【DeepSeek R1构建本地RAG知识库】向量数据库原理讲解

最新推荐文章于 2025-06-17 11:25:29 发布

Xd聊架构

最新推荐文章于 2025-06-17 11:25:29 发布

阅读量451

点赞数 10

CC 4.0 BY-SA版权

分类专栏：从0到1落地AI人工智能文章标签： ai rag 人工智能向量数据库知识库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq359605040/article/details/148070752

从0到1落地AI人工智能专栏收录该内容

21 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

文章目录

前言
一、什么是向量数据
二、关系型数据库存储方式
三、关系型数据库是否可以存向量数据
四、向量数据的由来
- 1.什么是向量数据？
- 2.菜谱的向量化
五、向量数据库的使用
六、向量数据库优缺点对比
七、常见问题QA
结尾

前言

在信息爆炸的时代，数据的形式早已不再局限于表格和数字。当我们试图构建一个智能问答系统或个性化推荐引擎时，传统的数据库似乎总是“力不从心”——它无法理解“煎蛋”和“炒蛋”的关联，也无法通过“红红黄黄的菜”这种模糊描述精准定位“番茄炒蛋”。而这一切，正是向量数据库的用武之地。

一、什么是向量数据

在深入探讨向量数据库之前，我们需要先理解一个核心概念——向量数据。向量数据库的核心功能是存储和查询高维向量，而向量数据的本质，是将现实世界的非结构化信息（如文本、图像、音频等）转化为计算机能理解的“数学语言”。

举个例子：想象我们在学做一道菜：番茄炒蛋，我们把准备阶段分三步：每一步都转化为空间三维坐标：

“番茄切块” → [0.7, -0.2, 1.3]
“打散鸡蛋” → [0.5, 1.1, -0.8]
“热锅放油” → [-1.2, 0.4, 0.6]

[0.7, -0.2, 1.3]这些就是向量数据！

每个步骤都被嵌入模型(Embedding)翻译成机器能懂的"位置坐标"(向量化)。就像把"番茄炒蛋步骤"变成地图上的定位点，方便快速查找。

实例应用：当你说"炒蛋前需要准备什么？"，嵌入模型会把它转换成类似[0.3, 1.2, -0.5]的坐标，然后在"菜谱地图"上找最近的坐标点。

这就是向量数据库的一个简单的使用，[0.7, -0.2, 1.3]里面的数量就是维度，768维就是有768个数。

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Xd聊架构 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。