当前位置: 首页 > news >正文

Redis 与 AI:从缓存到智能搜索的融合之路

Redis 与 AI:从缓存到智能搜索的融合之路

在当今数字化时代,Redis 不仅是一个高性能的缓存系统,更是一个强大的 AI 支持平台。Redis 通过其向量数据库功能和 AI 工具,为现代应用提供了独特的技术优势。

一、Redis 的 AI 能力

(一)向量数据库功能

Redis 的向量数据库功能是其 AI 能力的核心。它支持以下功能:

  1. 存储高维向量数据:Redis 可以存储向量及其相关的元数据,这些数据可以存储在哈希或 JSON 文档中。
  2. 执行相似性搜索:通过向量搜索(KNN 查询),Redis 可以快速找到与目标向量最相似的向量。
  3. 支持向量范围查询:允许用户基于向量距离进行范围查询。
  4. 元数据过滤功能:在执行向量搜索时,可以结合其他条件进行筛选,例如根据用户 ID 或类别过滤结果。

(二)RedisAI 模块

RedisAI 是 Redis 的一个模块,旨在将机器学习和深度学习带入 Redis 生态系统。它的主要特性包括:

  1. 张量存储:支持存储多维数组(张量),这些张量可以直接用作模型的输入或输出。
  2. 模型服务:支持加载和执行来自 TensorFlow、PyTorch 和 ONNX 的预训练模型。
  3. 脚本执行:通过 TorchScript 提供在 CPU 或 GPU 上执行预处理和后处理操作的能力。
  4. DAG 执行:允许定义和执行包含多个操作的有向无环图(DAG),实现复杂的推理管道。
  5. GPU 加速:支持 GPU 执行,充分利用硬件加速能力。

(三)Redis for AI

Redis for AI 是 Redis 提供的一套工具,旨在帮助开发者更高效地构建和部署 AI 应用。它包括:

  1. 向量数据库:提供世界上最快的向量数据库,支持高效的相似性搜索。
  2. 缓存解决方案:提供先进的缓存功能,减少对大型语言模型的依赖,降低成本并提升性能。
  3. 实时架构(RAG):支持基于检索增强生成(Retrieval Augmented Generation)的应用,提升智能体的推理能力和响应速度。

二、Redis 作为向量数据库的运行测试代码

(一)环境准备

  1. 安装 Redis Stack
    使用 Docker 安装 Redis Stack:

    docker run -d --name redis-stack -p 6379:6379 redis/redis-stack:latest
    
  2. 准备数据
    下面的代码展示了如何将数据存储到 Redis 中,并创建向量字段:

    import redis
    import numpy as np
    from redis.commands.search.field import TextField, VectorField
    from redis.commands.search.indexDefinition import IndexDefinition, IndexType
    from redis.commands.search.query import Query
    from sentence_transformers import SentenceTransformer
    
    # 连接 Redis
    client = redis.Redis(host="localhost", port=6379, decode_responses=True)
    
    # 存储向量数据
    keys = ["doc:1", "doc:2"]
    embeddings = np.array([[0.1, 0.2, 0.3], [0.4, 0.5, 0.6]], dtype=np.float32)
    for key, embedding in zip(keys, embeddings):
        client.hset(key, mapping={"embedding": embedding.tobytes()})
    
    # 创建索引
    schema = (
        TextField("id", no_stem=True, as_name="id"),
        VectorField(
            "embedding",
            "FLAT",
            {"TYPE": "FLOAT32", "DIM": 3, "DISTANCE_METRIC": "L2"},
            as_name="embedding",
        ),
    )
    definition = IndexDefinition(prefix=["doc:"], index_type=IndexType.HASH)
    client.ft("idx:docs").create_index(fields=schema, definition=definition)
    

(二)向量搜索测试

以下代码展示了如何执行向量搜索:

# 查询向量
query_embedding = np.array([0.1, 0.2, 0.3], dtype=np.float32)
query = (
    Query("(*)=>[KNN 2 @embedding $query_embedding AS score]")
    .sort_by("score")
    .return_fields("id", "score")
    .dialect(2)
)
results = client.ft("idx:docs").search(query, query_params={"query_embedding": query_embedding.tobytes()})
for doc in results.docs:
    print(doc)

三、Spring Boot 集成 Redis 向量数据库的代码案例

(一)环境准备

  1. 添加依赖
    pom.xml 文件中添加以下依赖:

    <dependency>
        <groupId>org.springframework.ai</groupId>
        <artifactId>spring-ai-redis-store-spring-boot-starter</artifactId>
    </dependency>
    
  2. 配置 Redis
    application.properties 文件中配置 Redis:

    spring.ai.vectorstore.redis.uri=redis://localhost:6379
    spring.ai.vectorstore.redis.index=default-index
    spring.ai.vectorstore.redis.prefix=default:
    

(二)使用 Redis 向量数据库

以下代码展示了如何在 Spring Boot 应用程序中使用 Redis 向量数据库:

@Autowired
private VectorStore vectorStore;

@PostMapping("/embedding")
public ResultEntity<Boolean> embedding(@RequestParam MultipartFile file) throws Exception {
    TikaDocumentReader tikaDocumentReader = new TikaDocumentReader(new InputStreamResource(file.getInputStream()));
    List<Document> splitDocuments = new TokenTextSplitter().apply(tikaDocumentReader.read());
    vectorStore.add(splitDocuments);
    return ResultUtils.success(true);
}

@GetMapping("/query")
public List<Document> query(@RequestParam String query) {
    return vectorStore.similaritySearch(query);
}

四、Redis 的 AI 应用场景

(一)实时数据缓存

Redis 的内存存储特性使其能够快速缓存 API 返回值,提高响应速度。例如,使用 LangChain 的 RedisCache 实现 LLM(大语言模型)的缓存功能:

set_llm_cache(RedisCache(redis_client));

(二)语义搜索与检索

Redis 的向量数据库功能可以用于语义搜索。例如,结合 LangChain 的 RedisVectorStore,可以实现智能搜索功能:

vector_store = RedisVectorStore(redis_client);

(三)会话持久化

Redis 可以记录和检索会话历史,增强对话系统的持续性。例如,使用 LangGraph 的 langgraph-checkpoint-redis,可以实现跨会话的持久化记忆。

五、总结

Redis 的 AI 能力和缓存功能的结合,为现代应用架构提供了强大的支持。通过合理配置和使用,可以在单一实例中同时满足缓存和向量搜索的需求,既节省了资源,又简化了系统架构。

相关文章:

  • UI设计系统:如何构建一套高效的设计规范?
  • S32K144入门笔记(二十三):FlexCAN解读(1)
  • SAP CO88根据标准价格拆分增量错误解决
  • SpringBoot实战:Excel文件上传、数据验证与存储全流程解析
  • EasyExcel导出导入excel工具类
  • 【创新项目实训个人博客】camel学习笔记(1)camel介绍
  • 【教程】如何利用bbbrisk一步一步实现评分卡
  • 设计模式(2)
  • 前端资源缓存策略全面解析:从原理到实践
  • 【Ultralytics YOLO COCO 评估脚本 | 获得COCO评价指标】
  • 鲲鹏920部署GAZELLE用户态协议栈
  • 通用智能人“通通”2.0发布,AI迈向“类人”智能新时代
  • 用Python做数据分析之数据统计
  • 在STM32H725多定时器同步移相(基于ASTM32CubeMX)
  • embedding 不同库和维度选型对比
  • 企业需要使用防病毒系统保障数据安全的原因
  • 批量修改记事本文本文件编码,可以解决文本文件乱码问题
  • 使用了C++11标准库中的随机数生成器
  • 医药企业数字化转型路径:从数据驱动到生态重构
  • GPT降智?静态住宅IP也许是关键!
  • 免费psd模板网站/关键词排名优化公司外包
  • 盐城网站建设价格/免费建站工具
  • 衡量网站质量的标准/百度pc端网页版
  • 做app模板网站有哪些内容/百度风云榜游戏排行榜
  • 贵阳的网站建设公司/泰安网站建设
  • 网站安全评估报告/百度搜索关键词设置