当前位置: 首页 > news >正文

es7.x es的高亮与solr高亮查询的对比对比说明

一  solr&es高亮

1.1 solr与es高亮功能

解释说明:

1)高亮配置:

fragmentSize(1000) 设置片段长度

numOfFragments(1) 指定返回的片段数量

preTags() 和 postTags() 设置高亮标记

2)字段处理差异:

在 ES 中,使用 matchQuery 而非 termQuery 进行内容查询,因为:

matchQuery 会分析查询文本,更适合高亮

termQuery 用于精确匹配,不适合片段提取

3)得分处理:

explain(true) 使返回结果包含评分信息

通过 hit.getScore() 获取文档相关性得分

4)高亮结果提取:获取第一个高亮片段的内容

hit.getHighlightFields().get("content").fragments()[0].string()

https://chat.deepseek.com/a/chat/s/cfd96216-b726-4e00-9e9b-a74afa0d1c7f

1.2 es高亮功能代码

1代码

在 Elasticsearch 中实现与 Solr 高亮代码相同功能的 Java 代码如下。这段代码实现了相同的功能:分页查询、返回所有字段和得分、对指定字段进行高亮并返回指定数量的片段:

import org.elasticsearch.action.search.SearchRequest;

import org.elasticsearch.action.search.SearchResponse;

import org.elasticsearch.client.RequestOptions;

import org.elasticsearch.client.RestHighLevelClient;

import org.elasticsearch.common.unit.TimeValue;

import org.elasticsearch.index.query.BoolQueryBuilder;

import org.elasticsearch.index.query.QueryBuilders;

import org.elasticsearch.search.SearchHit;

import org.elasticsearch.search.builder.SearchSourceBuilder;

import org.elasticsearch.search.fetch.subphase.highlight.HighlightBuilder;

import org.elasticsearch.search.sort.ScoreSortBuilder;

import org.elasticsearch.search.sort.SortOrder;

import java.util.Map;

// 1. 构建查询条件(使用之前的查询)

BoolQueryBuilder boolQuery = QueryBuilders.boolQuery()

    .must(QueryBuilders.termQuery("title.keyword", retrievalRequest.getCollectionName()))

    .must(QueryBuilders.matchQuery("content", keyword)); // 使用matchQuery而非termQuery以支持高亮

// 2. 创建搜索源构建器

SearchSourceBuilder sourceBuilder = new SearchSourceBuilder()

    .query(boolQuery)

    .from((pageRequest.getPageNumber() - 1) * pageRequest.getPageSize()) // 分页起始位置

    .size(pageRequest.getPageSize()) // 每页大小

    .fetchSource("*", null) // 返回所有字段,相当于Solr的addProjectionOnField(Field.of("*"))

    .explain(true); // 返回得分,相当于Solr的addProjectionOnField(Field.of("score"))

// 3. 构建高亮设置

HighlightBuilder highlightBuilder = new HighlightBuilder()

    .field(new HighlightBuilder.Field("content") // 要高亮的字段

        .fragmentSize(1000) // 高亮片段长度

        .numOfFragments(1) // 返回的片段数量

        .preTags("<span style='color:red'>") // 高亮前缀

        .postTags("</span>")) // 高亮后缀

    .requireFieldMatch(true); // 只高亮匹配字段

// 4. 添加到搜索源

sourceBuilder.highlighter(highlightBuilder);

// 5. 创建搜索请求

SearchRequest searchRequest = new SearchRequest("your_index_name"); // 对应Solr的"coll"

searchRequest.source(sourceBuilder);

// 6. 执行查询

SearchResponse response = client.search(searchRequest, RequestOptions.DEFAULT);

// 7. 处理结果

for (SearchHit hit : response.getHits().getHits()) {

    // 获取原始字段

    Map<String, Object> sourceAsMap = hit.getSourceAsMap();

    

    // 获取高亮内容

    if (hit.getHighlightFields().containsKey("content")) {

        String highlightedContent = hit.getHighlightFields().get("content").fragments()[0].string();

        // 将高亮内容设置到返回对象中

    }

    

    // 获取得分

    float score = hit.getScore();

}

http://www.dtcms.com/a/339282.html

相关文章:

  • 彻底清理旧版本 Docker 的痕迹
  • pytorch学习笔记-模型训练、利用GPU加速训练(两种方法)、使用模型完成任务
  • 常见的软件图片缩放,算法如何选择?
  • 深入解析Spring MVC运行流程:从请求到响应的完整旅程
  • 完整的训练与测试套路 小土堆pytorch记录
  • PyTorch自动求导
  • PID调节
  • Go 进阶学习路线
  • 传统艾灸VS七彩喜艾灸机器人:同样的艾香,多了4分“巧”
  • 电脑出现‘无法启动此程序,因为计算机中丢失dll’要怎么办?2025最新的解决方法分析
  • 家庭健康能量站:微高压氧舱结合艾灸机器人,智享双重养生SPA
  • 大模型基础:Foundamentals of LLM
  • 关于物理世界、感知世界、认知世界与符号世界统一信息结构的跨领域探索
  • 最近常问的70道vue相关面试题
  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器 | AIBase
  • 【Langchain系列七】Langchain+FastAPI(字符串输出与OpenAI规范流式输出)+FastGPT
  • 《若依》项目结构分析
  • 温故而知新 再看设计模式
  • 2025.8.19总结
  • 防抖技术(一)——OIS光学防抖技术详解
  • 块存储 对象存储 文件存储的区别与联系
  • plantsimulation知识点25.8.19 工件不在RGV中心怎么办?
  • 技术详解及案例汇总|JY-V620半导体RFID读写器在晶圆盒追踪中的使用
  • Aiseesoft iPhone Unlocker:轻松解决iPhone锁屏问题
  • 量子计算和超级计算机将彻底改变技术
  • 重置iPhone会删除所有内容吗? 详细回答
  • 【Cocos】2D关节组件
  • canoe发送接收报文不通到底是接口问题还是配置问题如何处理
  • Codeforces 斐波那契立方体
  • 【Pycharm虚拟环境中安装Homebrew,会到系统中去吗】