当前位置: 首页 > news >正文

Elasticsearch AI 语义搜索(semantic_text)

一、语义搜索

在传统的搜索系统中,Elasticsearch 一直依赖 倒排索引(inverted index)+ BM25 算法,这种方式非常适合关键词匹配,但存在明显的局限性:

  • 同义词问题:用户输入“手机”,但文档中写的是“智能电话”,传统搜索可能匹配不到。
  • 语义理解问题:用户输入“谁写了红楼梦?”,关键词搜索会检索“谁”、“写”、“红楼梦”,但很难直接理解用户意图。
  • 上下文问题:传统搜索不理解句子整体含义,例如“最好的编程语言是什么”,它只会匹配“最好”和“编程语言”,而不是理解这个问题是在寻找“排名”或“推荐”。

为了解决这些问题,Elasticsearch 从 8.0 版本开始,逐渐引入了 dense_vector 向量字段knn search、以及 semantic_text 查询,结合大语言模型(LLM)和向量搜索(vector search),构建出真正的 语义搜索(semantic search) 能力。


二、Elasticsearch 语义搜索核心原理

语义搜索的关键是 Embedding 向量化

  1. Emb

http://www.dtcms.com/a/356613.html

相关文章:

  • eslasticsearch+ik分词器+kibana
  • Linux系统部署:Certbot 实现 Nginx 自动续期部署 Let‘s Encrypt 免费 SSL 证书
  • matlab矩阵生成stl格式文件,适用于多孔介质图形生成
  • IAR工程如何生成compile_commands.json文件(能生成但是clangd不能生成“.cache文件”)
  • Spark算子调优
  • AAA服务器
  • Mock 在 API 研发中的痛点、价值与进化及Apipost解决方案最佳实践
  • 3.1 DataStream API 编程模型
  • YARN架构解析:深入理解Hadoop资源管理核心
  • Ubuntu 服务器 KERNEL PANIC 修复实录
  • Java-面试八股文-Mysql篇
  • 【前端教程】从性别统计类推年龄功能——表单交互与数据处理进阶
  • IDEA之GO语言开发
  • cssword属性
  • 深度拆解 OpenHarmony 位置服务子系统:从 GNSS 到分布式协同定位的全链路实战
  • 20250829_SQLserver数据库_Server ip10.5.7.44在客户端用Navicat创建一个WATDB_ANDON数据库下的只读用户
  • 【小白笔记】Visual Studio 在 2025年7月更新的功能说明(英文单词记忆)
  • 软考 系统架构设计师系列知识点之杂项集萃(135)
  • TF-IDF:文本分析的“火眼金睛”
  • 绿幕电商直播为什么要用专业抠图软件.
  • 新手向:从零开始理解百度语音识别API的Python实现
  • CLion 中配置运行 Qt 项目指南
  • C++ 高阶错误解析:MSVC 与 Qt 全景指南
  • 如何设置阿里云轻量应用服务器镜像?
  • Maya绑定:连接编辑器的简单使用
  • 卷积理解-excel数据图表演示
  • 开源大语言模型(Qwen3)
  • 基于Velero + 阿里云 OSS的Kubernetes 集群的备份与恢复
  • Kubernetes 与 GitOps 的深度融合实践指南
  • 国产数据库转型指南:DBA技能重构与职业发展