当前位置：首页 > news >正文

什么是向量数据库

news 2025/9/17 9:32:53

目录

一、一句话概括

二、核心概念拆解

1. 什么是“向量”？

2. 什么是“数据库”？

三、向量数据库是干什么的？（解决了什么问题）

四、一个生动的类比：图书馆 vs 专家助手

五、为什么需要专门的向量数据库？不能用传统数据库吗？

六、主要应用场景

总结

一、一句话概括

向量数据库是一种专门设计用于存储、管理和快速检索“向量”的特殊数据库。

你可以把它想象成一个超级高效的“内容相似度搜索引擎”。它不像谷歌那样根据关键词匹配来搜索，而是根据“意思”或“内容”的相似性来查找信息。说白了就是可以用作AI检索

二、核心概念拆解

1. 什么是“向量”？

向量就是一串数字，比如 [0.23, -0.45, 0.91, ..., 0.67]。这串数字通常很长（几百到几千维）。
在AI世界里，任何东西（文字、图片、音频、视频）都可以通过一个AI模型（称为“嵌入模型”）转换成一串有意义的数字，即向量。这个过程叫做“嵌入”。
关键点： 这串数字不是随机的，它代表了原始内容的语义或特征。内容越相似，它们的向量在数学空间里的“距离”就越近。

举个例子：

句子“我喜欢吃苹果” -> 转换为向量 A
句子“我爱吃芒果” -> 转换为向量 B
句子“今天的股价涨了” -> 转换为向量 C

向量 A 和 B 的距离会很近（都在说“喜欢吃水果”），而它们与向量 C 的距离会很远（完全不同的话题）。

2. 什么是“数据库”？

数据库就是存储和管理数据的地方。我们熟悉的MySQL、Oracle存储的是表格、文字和数字，你可以用“=”、“>”等精确条件来查询。
但当你问它“查找所有和‘健康饮食’相关的段落”时，传统的数据库就无能为力了，因为它不理解“相关”是什么意思。

三、向量数据库是干什么的？（解决了什么问题）

传统数据库擅长精确查询（Query by Exact Match），而向量数据库擅长相似性查询（Query by Similarity）。

它的核心功能是：
你给它一个查询内容（比如一个问题），它能飞速地从海量数据中找出最相似、最相关的内容。

这个过程叫做“向量相似性搜索”或“最近邻搜索”：

输入： 你的问题 -> 也被模型转换成向量 Q。
计算： 向量数据库计算向量 Q 和库中所有向量的“距离”（相似度）。
输出： 返回距离最近（即最相关）的几个向量所对应的原始内容。

四、一个生动的类比：图书馆 vs 专家助手

传统数据库 like 传统图书馆：
- 你问：“有一本叫《人类简史》的书吗？”
- 管理员通过精确的书名在卡片目录或系统里找到它，然后告诉你它在哪个架子上。（精确匹配）
向量数据库 like 一个博学的专家助手：
- 你问：“我想了解人类早期农业是如何发展的？”
- 助手理解了你问题的核心意思，然后从他脑海的知识海洋里，不仅找出了《人类简史》中相关的章节，还找出了《枪炮、病菌与钢铁》里的某些段落，甚至是一篇相关的考古论文，并把它们提供给你。（语义相似性搜索）

向量数据库就是这个“博学的专家助手”。

五、为什么需要专门的向量数据库？不能用传统数据库吗？

可以，但效率极低。想象一下：

库里有1亿个向量（每个向量有768个数字）。
你的查询向量进来后，传统数据库需要计算1亿次，每次计算768个数字的差值，然后再排序。
这个过程会慢到无法接受（可能需要几分钟甚至小时）。

向量数据库的优化：
它使用了各种高级算法（如HNSW, IVF-PQ）和数据结构，通过预先对向量进行聚类、索引等操作，将搜索范围从“全库扫描”缩小到“几个可能相似的区域”，从而将搜索时间从“分钟级”缩短到“毫秒级”。这就是它的核心价值。

六、主要应用场景

检索增强生成（RAG）：这正是你提供的那段代码的用途！先从向量库中检索出与问题最相关的知识片段，再让LLM基于这些片段生成答案，保证答案准确、最新。
语义搜索：比如在电商平台搜索“适合夏天穿的透气衣服”，它能找到所有描述为“凉爽”、“轻薄”、“棉麻”的商品，而不只是标题里带“夏天”的商品。
图片/视频搜索：用一张图片去搜索相似的图片（以图搜图）。图片被转换为向量后，搜索就变成了向量间的相似度计算。
推荐系统：你喜欢了商品A，系统将A转换为向量，然后在库中寻找向量相似的商品B、C、D推荐给你。
异常检测：正常操作的数据向量都聚集在一起，一个异常的向量会离它们很远，从而被识别出来。

总结

特性	传统数据库 (MySQL, Oracle)	向量数据库 (Chroma, Pinecone)
存储内容	数字、字符串、日期等结构化数据	向量（代表语义的数字数组）
查询方式	精确匹配 (`=`, `>`, `LIKE '%abc%'`)	相似度匹配（找最相近的）
核心能力	事务处理、一致性	高速相似性搜索
理解能力	不理解数据含义	理解数据间的语义关系

所以，你提供的代码中的 vector_db.add_documents(documents)，就是在完成知识入库的关键一步：将文档的语义转化为向量，存起来，以备后续进行高速、精准的语义检索。

文章转载自：

http://kZOe6uxU.qfLwp.cn
http://07f1GOF6.qfLwp.cn
http://v2vnXs0C.qfLwp.cn
http://iUahMfUV.qfLwp.cn
http://c3O9UkqH.qfLwp.cn
http://LFPiesWP.qfLwp.cn
http://WCdxTSF8.qfLwp.cn
http://DqRKu22t.qfLwp.cn
http://qh5xobT3.qfLwp.cn
http://3IBtGn4d.qfLwp.cn
http://ksCvGsgl.qfLwp.cn
http://C7BJj8mC.qfLwp.cn
http://k3mjkLXK.qfLwp.cn
http://SYS3Ihbl.qfLwp.cn
http://WT2DD2S0.qfLwp.cn
http://6JlwqIsD.qfLwp.cn
http://88VKicaa.qfLwp.cn
http://a6s5AprN.qfLwp.cn
http://wiMnjZmd.qfLwp.cn
http://BTJGAJ9S.qfLwp.cn
http://odebFWlB.qfLwp.cn
http://vcBEhqzm.qfLwp.cn
http://JRkW6mEp.qfLwp.cn
http://uZ7YW707.qfLwp.cn
http://m1or2BNJ.qfLwp.cn
http://kgpa6O8M.qfLwp.cn
http://6WJFgl6t.qfLwp.cn
http://LfldfvdY.qfLwp.cn
http://rzch3l18.qfLwp.cn
http://iH3OPKBL.qfLwp.cn

http://www.dtcms.com/a/386668.html

相关文章：

利用postgres_proto和pgproto测试postgres协议访问duckdb

拼多多-----anti_content逆向分析

【一文了解】Unity的协程(Coroutine)与线程(Thread)

贪心算法在网络入侵检测（NID）中的应用

数据搬家后如何处理旧 iPhone

[react native招聘]

IDE工具RAD Studio 13 Florence重磅发布：64 位 IDE + AI 组件全面升级！

session存储

Another Redis Desktop Manager 的 SCAN 使用问题与风险分析

MATLAB绘制一个新颖的混沌图像(新四翼混沌系统)

AI起名工具

typeScript 装饰器

【算法磨剑：用 C++ 思考的艺术・单源最短路进阶】Bellman-Ford 与 SPFA 算法模板精讲，突破负权边场景

单元测试：驱动模块与桩模块在自顶向下和自底向上的策略中的作用

SpringBoot MVC 快速入门

Nature Communications 北京大学联合德国马普所在触觉传感器方面取得进展，实现机器人指尖超分辨率力感知

解决一次 “Failed to load model because protobuf parsing failed”：从现象到根因与修复

从ppm到ppb：全面解读浓度单位转换的诀窍

贪心算法应用：霍夫曼编码详解

NLP Subword 之 BBPE(Byte-level BPE) 算法原理

【nodejs】Windows7系统下如何安装nodejs16以上版本

Part05 数学

每天五分钟深度学习：深层神经网络的优势

PCGrad解决多任务冲突

第十一章：游戏玩法和屏幕特效-Gameplay and ScreenEffects《Unity Shaders and Effets Cookbook》

Choerodon UI V1.6.7发布！为 H-ZERO 开发注入新动能

科教共融，具创未来！节卡助力第十届浦东新区机器人创新应用及技能竞赛圆满举行

食品包装 AI 视觉检测技术：原理、优势与数据应用解析

【深度学习计算机视觉】05：多尺度目标检测之FPN架构详解与PyTorch实战

从工业革命到人工智能：深度学习的演进与核心概念解析