当前位置: 首页 > wzjs >正文

做视觉影像网站用什么软件系统正国级领导有几位

做视觉影像网站用什么软件系统,正国级领导有几位,网站设计建设一般多少钱,云南省建设厅定额网站作者:来自 Elastic Vincent Bosc 学习如何在 Elasticsearch 中使用稀疏向量,以最小的复杂性提升相关性并实现搜索结果个性化。 稀疏向量是 ELSER 中的关键组件,但它们的用途远不止于此。在这篇文章中,我们将探讨稀疏向量如何在电商…

作者:来自 Elastic Vincent Bosc

学习如何在 Elasticsearch 中使用稀疏向量,以最小的复杂性提升相关性并实现搜索结果个性化。

稀疏向量是 ELSER 中的关键组件,但它们的用途远不止于此。在这篇文章中,我们将探讨稀疏向量如何在电商场景中提升搜索相关性:基于搜索行为(如点击)和用户偏好对文档进行加权。

什么是稀疏向量?

向量搜索是当前的热门话题,但大多数讨论集中在密集向量上:用于机器学习和神经搜索的紧凑型数值表示。而稀疏向量则采用了不同的路径。

与紧密压缩数据的密集向量不同,稀疏向量以更具可解释性和结构化的格式存储信息,通常包含大量的零。虽然没有那么受关注,但在合适的场景下,它们的能力是非常强大的。

💡 趣味小知识:稀疏向量和倒排索引都利用稀疏性来高效地表示和检索信息。

在 Elasticsearch 中,你可以使用 sparse_vector 字段类型来存储稀疏向量:这并不令人意外。

使用稀疏向量进行查询

在 Elasticsearch 中使用稀疏向量进行搜索的体验类似于传统的关键词搜索,但有所不同。稀疏向量查询(sparse vector queries)不是直接匹配词项,而是使用加权词项和点积,根据文档与查询向量的匹配程度来评分。

用例 1:通过信号增强提升搜索排名

信号增强是指强调某些特征或词项以提升搜索排名。当业务逻辑或用户行为表明某些结果应该排在更前时,这种方法尤其有用。

假设我们正在处理一个简单的电商索引:

PUT marketplace
{"mappings": {"properties": {"title": {"type": "text"},"query_boost": {"type": "sparse_vector"},"customer_types": {"type": "sparse_vector"}}}
}

现在,让我们只使用传统的 full text 类型来索引两个文档:

POST marketplace/_doc/1
{"title": "playstation 5 - special offer"
}POST marketplace/_doc/2
{"title": "playstation controller"
}

对 “playstation” 的基本搜索会首先返回控制器,而不是因为它更相关,而是因为默认的词法评分算法 BM25 倾向于偏好较短的字段,导致标题简洁的控制器排名更高。更多的内容可以参阅 “Elasticsearch:分布式计分 - TF-IDF”。

GET marketplace/_search
{"query": {"match": {"title": "playstation"}}
}"hits": [{"_index": "marketplace","_id": "2","_score": 0.21110919,"_source": {"title": "playstation controller"}},{"_index": "marketplace","_id": "1","_score": 0.160443,"_source": {"title": "playstation 5 - special offer"}}
]

但我们希望提升 console 的搜索结果,特别是因为它有特价优惠!

一种实现方式是通过稀疏向量将增强信号直接嵌入到文档中:

POST marketplace/_doc/1
{"title": "playstation 5 - special offer","query_boost": [{"playstation": 3, "game console": 1}]
}

这个文档现在在搜索查询 “playstation” 和 “game console” 中具有了额外的权重。

我们可以调整查询,以结合这个稀疏向量的增强效果:

GET marketplace/_search
{"query": {"bool": {"must": [{"match": {"title": "playstation"}}],"should": [{"sparse_vector": {"field": "query_boost","query_vector": {"playstation": 1}}}]}}
}"hits": [{"_index": "marketplace","_id": "1","_score": 3.160443,"_source": {"title": "playstation 5 - special offer",}},{"_index": "marketplace","_id": "2","_score": 0.21110919,"_source": {"title": "playstation controller"}}
]

得益于稀疏向量匹配所带来的额外得分,console 现在排在了 controller 之前,这正是我们想要的结果!

这种方法提供了一种替代传统增强技术的方式,例如 function_score 查询或字段级权重调整。通过使用稀疏向量将增强信息直接存储在文档中,你可以在调整相关性时获得更高的灵活性和透明度。同时,它还实现了业务逻辑与查询逻辑的解耦。

不过,也需要注意权衡:对于一些简单的使用场景,传统的增强方式可能更容易实现,并且在某些情况下性能更优。而当你需要更细粒度、具有多维控制的增强方式时,稀疏向量的优势就会凸显出来。

提醒: must 子句会进行过滤并影响评分,而 should 子句在条件匹配时会增加评分。

用例 2:使用稀疏向量实现个性化

稀疏向量同样可以实现个性化。你可以为客户特征或用户画像分配权重,并利用这些权重为个体用户展示最相关的产品。

以下是一个示例:

POST marketplace/_doc/3
{"title": "High fructose snack bar with artificial flavor"
}POST marketplace/_doc/4
{"title": "Snack bar with whole food ingredients","customer_types": {"healthy-conscious": 3}
}

假设 Jim 是一位偏好健康、可持续选项的客户:

POST user/_doc/jim
{"customer-types": {"healthy-conscious": 2"tech-savvy": 1,"eco-friendly": 1}
}

我们可以根据 Jim 的偏好定制搜索体验:

GET marketplace/_search
{"query": {"bool": {"must": [{"match": {"title": "snack bar"}}],"should": [{"sparse_vector": {"field": "customer_types","query_vector": {"healthy-conscious": 2,"tech-savvy": 1,"eco-friendly": 1}}}]}}
}"hits": [{"_index": "marketplace","_id": "4","_score": 7.2515574,"_source": {"title": "Snack bar with whole food ingredients","customer_types": {"healthy-conscious": 3}}},{"_index": "marketplace","_id": "3","_score": 1.1612647,"_source": {"title": "High fructose snack bar with artificial flavor"}}
]

因此,更健康的能量棒出现在搜索结果的顶部,因为这更符合 Jim 的购买倾向。

这种通过稀疏向量实现的个性化方法,基于类似于静态用户标签的理念,但使其更具动态性和表现力。与其将用户归类为某个单一标签(如 “tech-savvy - 技术达人” 或 “healthy-conscious - 健康意识强”),稀疏向量可以表示多个偏好,并赋予不同的权重,而且这些权重可以直接整合进搜索排名过程。

使用 function_score 查询来融入用户偏好是一种灵活的个性化替代方案,但随着逻辑的复杂化,它可能变得难以维护。另一种常见的方法是协同过滤(collaborative filtering),它依赖外部系统来计算用户与商品之间的相似度,通常需要额外的基础设施支持。学习排序(LTR)也可以应用于个性化,具备强大的排序能力,但在特征工程和模型训练方面要求较高的成熟度。

总结

稀疏向量是你搜索工具箱中的一个多功能补充。我们只介绍了两个实际的例子:提升搜索结果和基于用户画像实现个性化。但它的应用范围非常广泛。

通过将结构化、加权的信息直接嵌入到文档中,你可以以最小的复杂度实现更智能、更相关的搜索体验。

Elasticsearch 拥有许多新功能,帮助你为特定用例构建最佳搜索解决方案。深入了解我们的示例笔记本,开始免费云试用,或者现在就试试在本地机器上运行 Elastic。

原文:Enhancing relevance with sparse vectors - Elasticsearch Labs


文章转载自:

http://kroWKSnU.zpstm.cn
http://VmMxZxmN.zpstm.cn
http://GHzXKmnG.zpstm.cn
http://YQ8UjzJx.zpstm.cn
http://imdqmHjs.zpstm.cn
http://xcYqF9qQ.zpstm.cn
http://KVVgZVyQ.zpstm.cn
http://VKh6csfi.zpstm.cn
http://YIpgWjuc.zpstm.cn
http://G6YIuv6c.zpstm.cn
http://znFInZ9v.zpstm.cn
http://OFe2aR7n.zpstm.cn
http://pHABI0Aq.zpstm.cn
http://218gujbh.zpstm.cn
http://P2plp2kX.zpstm.cn
http://efrIkUpF.zpstm.cn
http://0zZk6Hf9.zpstm.cn
http://RW5OsoR4.zpstm.cn
http://1Z7t3joW.zpstm.cn
http://e7YhpsxL.zpstm.cn
http://G7EOpOes.zpstm.cn
http://J2tkg6yJ.zpstm.cn
http://Qe34pMXP.zpstm.cn
http://b6MTi10J.zpstm.cn
http://YfuSYIw7.zpstm.cn
http://Y66NF1JZ.zpstm.cn
http://GZr9CF0T.zpstm.cn
http://QzeGJVTh.zpstm.cn
http://PvtsBpvS.zpstm.cn
http://rVdt9HNv.zpstm.cn
http://www.dtcms.com/wzjs/672983.html

相关文章:

  • dede网站图标wordpress登录链接修改
  • 大学文明校园网站建设方案网络营销是一种什么专业
  • 网站系统中备案申请表做的网站一模一样会被告吗
  • 网页设计网站含义网页网站的制作过程
  • 免费网站制作软件的app模板网站可以做seo吗
  • 深圳平台网站建设外包网站配置域名
  • 宿州科技网站建设公司国际网站怎么做
  • 黄山建设网站公司电话号码机械设备上海网站建设
  • 公司建设网站的服务费广州番禺建网站
  • 南充网站建设与维护优秀网站案例欣赏
  • 电商网站模板下载东莞网站包年优化
  • 做外贸网站公司哪家消费全返的 微网站开发
  • 韶关网站seo高校工会网站建设
  • 建设京东物流网站的目标是什么荣成网站开发
  • ps免费模板网站网上花店网页制作素材
  • 郑州做网站企起wordpress合并压缩
  • 怎么做网站账号注册机网站建设的博客
  • 手机模板网站下载设计软件网站
  • 郑州网站定制门户网站的建设要求
  • 自己做网站iis设置免费做婚礼邀请函的网站
  • 建设网站地图素材网站模板代理电话
  • 摄影师作品网站有哪些wordpress微信编辑器
  • 快站app官网下载flv网站建设
  • 公司网站建设发展趋势潍坊网站排名优化
  • 徐州网站制作建设网页设计与网站建设程序作业
  • 邢台123交友信息手机版百度seo优化规则
  • 制作网站可用性监控wordpress加置顶功能
  • 东莞专业微网站建设wordpress网站怎么建设
  • 网站建设要经历哪些步骤?公司主页怎么制作
  • 网站建设凡客dede安装好后是模板怎么变成做好的网站