当前位置：首页 > news >正文

Redis 与 AI：从缓存到智能搜索的融合之路

news 2025/10/14 21:36:53

Redis 与 AI：从缓存到智能搜索的融合之路

在当今数字化时代，Redis 不仅是一个高性能的缓存系统，更是一个强大的 AI 支持平台。Redis 通过其向量数据库功能和 AI 工具，为现代应用提供了独特的技术优势。

一、Redis 的 AI 能力

（一）向量数据库功能

Redis 的向量数据库功能是其 AI 能力的核心。它支持以下功能：

存储高维向量数据：Redis 可以存储向量及其相关的元数据，这些数据可以存储在哈希或 JSON 文档中。
执行相似性搜索：通过向量搜索（KNN 查询），Redis 可以快速找到与目标向量最相似的向量。
支持向量范围查询：允许用户基于向量距离进行范围查询。
元数据过滤功能：在执行向量搜索时，可以结合其他条件进行筛选，例如根据用户 ID 或类别过滤结果。

（二）RedisAI 模块

RedisAI 是 Redis 的一个模块，旨在将机器学习和深度学习带入 Redis 生态系统。它的主要特性包括：

张量存储：支持存储多维数组（张量），这些张量可以直接用作模型的输入或输出。
模型服务：支持加载和执行来自 TensorFlow、PyTorch 和 ONNX 的预训练模型。
脚本执行：通过 TorchScript 提供在 CPU 或 GPU 上执行预处理和后处理操作的能力。
DAG 执行：允许定义和执行包含多个操作的有向无环图（DAG），实现复杂的推理管道。
GPU 加速：支持 GPU 执行，充分利用硬件加速能力。

（三）Redis for AI

Redis for AI 是 Redis 提供的一套工具，旨在帮助开发者更高效地构建和部署 AI 应用。它包括：

向量数据库：提供世界上最快的向量数据库，支持高效的相似性搜索。
缓存解决方案：提供先进的缓存功能，减少对大型语言模型的依赖，降低成本并提升性能。
实时架构（RAG）：支持基于检索增强生成（Retrieval Augmented Generation）的应用，提升智能体的推理能力和响应速度。

二、Redis 作为向量数据库的运行测试代码

（一）环境准备

安装 Redis Stack
使用 Docker 安装 Redis Stack：

docker run -d --name redis-stack -p 6379:6379 redis/redis-stack:latest

准备数据
下面的代码展示了如何将数据存储到 Redis 中，并创建向量字段：

import redis
import numpy as np
from redis.commands.search.field import TextField, VectorField
from redis.commands.search.indexDefinition import IndexDefinition, IndexType
from redis.commands.search.query import Query
from sentence_transformers import SentenceTransformer

# 连接 Redis
client = redis.Redis(host="localhost", port=6379, decode_responses=True)

# 存储向量数据
keys = ["doc:1", "doc:2"]
embeddings = np.array([[0.1, 0.2, 0.3], [0.4, 0.5, 0.6]], dtype=np.float32)
for key, embedding in zip(keys, embeddings):
    client.hset(key, mapping={"embedding": embedding.tobytes()})

# 创建索引
schema = (
    TextField("id", no_stem=True, as_name="id"),
    VectorField(
        "embedding",
        "FLAT",
        {"TYPE": "FLOAT32", "DIM": 3, "DISTANCE_METRIC": "L2"},
        as_name="embedding",
    ),
)
definition = IndexDefinition(prefix=["doc:"], index_type=IndexType.HASH)
client.ft("idx:docs").create_index(fields=schema, definition=definition)

（二）向量搜索测试

以下代码展示了如何执行向量搜索：

# 查询向量
query_embedding = np.array([0.1, 0.2, 0.3], dtype=np.float32)
query = (
    Query("(*)=>[KNN 2 @embedding $query_embedding AS score]")
    .sort_by("score")
    .return_fields("id", "score")
    .dialect(2)
)
results = client.ft("idx:docs").search(query, query_params={"query_embedding": query_embedding.tobytes()})
for doc in results.docs:
    print(doc)

三、Spring Boot 集成 Redis 向量数据库的代码案例

（一）环境准备

添加依赖
在 pom.xml 文件中添加以下依赖：

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-redis-store-spring-boot-starter</artifactId>
</dependency>

配置 Redis
在 application.properties 文件中配置 Redis：

spring.ai.vectorstore.redis.uri=redis://localhost:6379
spring.ai.vectorstore.redis.index=default-index
spring.ai.vectorstore.redis.prefix=default:

（二）使用 Redis 向量数据库

以下代码展示了如何在 Spring Boot 应用程序中使用 Redis 向量数据库：

@Autowired
private VectorStore vectorStore;

@PostMapping("/embedding")
public ResultEntity<Boolean> embedding(@RequestParam MultipartFile file) throws Exception {
    TikaDocumentReader tikaDocumentReader = new TikaDocumentReader(new InputStreamResource(file.getInputStream()));
    List<Document> splitDocuments = new TokenTextSplitter().apply(tikaDocumentReader.read());
    vectorStore.add(splitDocuments);
    return ResultUtils.success(true);
}

@GetMapping("/query")
public List<Document> query(@RequestParam String query) {
    return vectorStore.similaritySearch(query);
}

四、Redis 的 AI 应用场景

（一）实时数据缓存

Redis 的内存存储特性使其能够快速缓存 API 返回值，提高响应速度。例如，使用 LangChain 的 RedisCache 实现 LLM（大语言模型）的缓存功能：

set_llm_cache(RedisCache(redis_client));

（二）语义搜索与检索

Redis 的向量数据库功能可以用于语义搜索。例如，结合 LangChain 的 RedisVectorStore，可以实现智能搜索功能：

vector_store = RedisVectorStore(redis_client);

（三）会话持久化

Redis 可以记录和检索会话历史，增强对话系统的持续性。例如，使用 LangGraph 的 langgraph-checkpoint-redis，可以实现跨会话的持久化记忆。

五、总结

Redis 的 AI 能力和缓存功能的结合，为现代应用架构提供了强大的支持。通过合理配置和使用，可以在单一实例中同时满足缓存和向量搜索的需求，既节省了资源，又简化了系统架构。

查看全文

http://www.dtcms.com/a/104584.html

UI设计系统：如何构建一套高效的设计规范？

S32K144入门笔记（二十三）：FlexCAN解读（1）

SAP CO88根据标准价格拆分增量错误解决

SpringBoot实战：Excel文件上传、数据验证与存储全流程解析

EasyExcel导出导入excel工具类

【创新项目实训个人博客】camel学习笔记（1）camel介绍

【教程】如何利用bbbrisk一步一步实现评分卡

设计模式（2）

前端资源缓存策略全面解析：从原理到实践

【Ultralytics YOLO COCO 评估脚本 | 获得COCO评价指标】

鲲鹏920部署GAZELLE用户态协议栈

通用智能人“通通”2.0发布，AI迈向“类人”智能新时代

用Python做数据分析之数据统计

在STM32H725多定时器同步移相（基于ASTM32CubeMX）

embedding 不同库和维度选型对比

企业需要使用防病毒系统保障数据安全的原因

批量修改记事本文本文件编码，可以解决文本文件乱码问题

使用了C++11标准库中的随机数生成器

医药企业数字化转型路径：从数据驱动到生态重构

GPT降智？静态住宅IP也许是关键！

前端react 实现分段进度条

Linux（25）——进程调度

SQL Server ：可用性组 automatic seeding

Visual Studio Code配置自动规范代码格式

大语言模型智体的综述：方法论、应用和挑战（上）

随性研究c++-智能指针

扫描仪+文档pdf编辑器+pdf格式转换器

电力系统惯量及其作用解析

移动端动态化建设的演进与实践：从技术革新到生态繁荣

DAY 33 leetcode 383--哈希表.赎金信 49--字母异位词分组