当前位置: 首页 > news >正文

关于weaviate的关键词和向量搜索优劣

模式搜索逻辑适合场景
向量搜索语义匹配,靠向量距离表达相似但用词不同(如同义句)
关键词搜索字面匹配,靠关键词命中用户输入的是“关键词”或短语

举例对比:

记忆内容:

“Java 架构师的名字是 Tom。”

用户查询:
  1. “谁是架构师?”
    → 向量搜索能命中(意思接近)
    → 关键词搜索完全没命中

  2. “Tom” / “架构师” / “Java”
    → 关键词能命中(文本含词)
    → 向量搜索反而未必命中(向量分数太低)


为什么“向量可能搜不到关键词命中内容”?

因为向量搜索是“语义空间”的距离:

  • 如果用户输入的词非常简短或抽象(如“好”、“人名”、“单字”)

  • 或者模型 embedding 不够准确

  • 或者你用了 certainty > 0.85 做了剪枝

就会出现:语义向量搜不到,字面却包含关键词的情况


关键词 fallback 就是为这种“精确小词匹配”兜底设计的

  • 向量搜索负责“语义相关”

  • 关键词搜索负责“精确命中”

两者结合:即使 embedding 模型不够完美、内容风格多变,也能最大限度保证记忆被找回来。

相关文章:

  • react实现鼠标悬停在SVG地图上某个区域时,其上方呈现柱形图
  • docker部署jenkins并成功自动化部署微服务
  • Linux: network :创建raw socket的时候
  • [GN] sigrokdecode 模块
  • 【Java面试系列】Spring Boot中自动配置原理与自定义Starter开发实践详解 - 3-5年Java开发必备知识
  • Python第七章10:异常、模块、包的综合案例
  • 【组件封装-优化】vue+element plus:二次封装select组件,实现下拉列表有分页、自定义是否可搜索的一系列功能
  • Apache Airflow开源程序是一个以编程方式编写、计划和监控工作流程的平台
  • 苹果内购支付 Java 接口
  • 蓝桥杯:日期统计
  • 基于STM32、HAL库的CH224K 快充协议芯片简介及驱动程序设计
  • AI平台如何实现推理?数算岛是一个开源的AI平台(主要用于管理和调度分布式AI训练和推理任务。)
  • 【Java设计模式】第7章 建造者模式讲解
  • class与构造函数
  • Podman配置
  • AI在未来会不会代替人工???
  • Redis中AOF的实现方式和AOF重写
  • 运动规划实战案例 | 基于可视图的路径规划算法(附ROS C++/Python仿真)
  • 动态列表的数据渲染、新增、编辑等功能开发及数据处理
  • MySQL安装与基础配置(Windows版以及linux版)
  • 淘宝网站建设好评语/武汉it培训机构排名前十
  • 简洁风格的网站模板免费下载/推广产品的方法
  • 汕头网站关键词排名/广州网站优化工具
  • b2b网站推广方案怎么写/裂变营销五种模式十六种方法
  • 网站空间数据库需要多大/福州网站建设团队
  • 奉贤网站建设哪家好/网站注册域名