当前位置：首页 > news >正文

ElasticSearch倒排索引、ES核心概念、JAVA集成ES操作

news 2025/10/24 8:36:22

目录

一、倒排索引

IK分词器：

二、ES核心概念：

创建索引库：

文档操作：

批量处理：

三、JavaRestClient：

客户端初始化：

商品Mapping映射：

索引库操作：

JAVA中操作文档：

新增文档：

删除文档：

查询文档：

修改文档：

全量更新：

局部更新：

JAVA中操作文档小结：

批处理：

一、倒排索引

IK分词器：

接下来我们来安装一下IK分词器：

1.在虚拟机当中输入：docker volume ls查看数据卷，找到elasticsearch的插件：

2.根据插件名称查看内部路径信息：docker volume inspect es-plugins

3.将我们解压后的elasticsearch-analysis-ik-7.12.1文件夹放到该路径下：

最终重启（docker restart es）就可以啦

这里简单口述一下分词器的原理，实际上就是分词器当中有一个词典，词典包含了中文大部分的有意义的词句；当我们输入一串搜索内容时，分词器将这一串内容分成一个个符号，通过一个一个、两个两个、三个三个......的方式逐个遍历拼接，然后到词典当中查找，如果有该词，则放入结果集当中，没有则不管；但是随着时代发展，很多网络用词、新词逐渐出现，这样我们在词典当中是查不到这个词的，也就不会触发文档的返回；所以我们可以在config目录下的文件配置新词，而且还可以设置屏蔽词

二、ES核心概念：

创建索引库：

相当于是数据库当中创建表

ES默认不允许修改已有的映射，但是可以添加：

文档操作：

相当于是数据库当中操作数据

全量修改：先删除后新增

局部修改（增量修改）

批量处理：

三、JavaRestClient：

客户端初始化：

1.在item-service微服务当中引入依赖：（因为商品查找功能在该服务当中）

<dependency><groupId>org.elasticsearch.client</groupId><artifactId>elasticsearch-rest-high-level-client</artifactId>
</dependency>

2.到父工程当中指定ES版本：（由于SpringBoot当中内置了es但是版本不一致，所以需要另外配置）

  <properties><elasticsearch.version>7.12.1</elasticsearch.version></properties>

3.初始化RestHighLevelClient：

RestHighLevelClient client = new RestHighLevelClient(RestClient.builder(HttpHost.create("http://192.168.150.101:9200")
));

商品Mapping映射：

PUT /items
{"mappings": {"properties": {"id": {"type": "keyword"},"name":{"type": "text","analyzer": "ik_smart"},"price":{"type": "integer"},"image":{"type": "keyword","index": false},"category":{"type": "keyword"},"brand":{"type": "keyword"},"sold":{"type": "integer"},"commentCount":{"type": "integer","index": false},"isAD":{"type": "boolean"},"updateTime":{"type": "date"}}}
}

索引库操作：

JAVA中操作文档：

新增文档：

删除文档：

查询文档：

修改文档：

全量更新：

局部更新：

JAVA中操作文档小结：

批处理：

当我们要导入商品数据时，由于商品数量达到数十万，因此不可能一次性全部导入。建议采用循环遍历方式，每次导入1000条左右的数据。

item-service的DocumentTest测试类中，编写单元测试：

@Test
void testLoadItemDocs() throws IOException {// 分页查询商品数据int pageNo = 1;int size = 1000;while (true) {Page<Item> page = itemService.lambdaQuery().eq(Item::getStatus, 1).page(new Page<Item>(pageNo, size));// 非空校验List<Item> items = page.getRecords();if (CollUtils.isEmpty(items)) {return;}log.info("加载第{}页数据，共{}条", pageNo, items.size());// 1.创建RequestBulkRequest request = new BulkRequest("items");// 2.准备参数，添加多个新增的Requestfor (Item item : items) {// 2.1.转换为文档类型ItemDTOItemDoc itemDoc = BeanUtil.copyProperties(item, ItemDoc.class);// 2.2.创建新增文档的Request对象request.add(new IndexRequest().id(itemDoc.getId()).source(JSONUtil.toJsonStr(itemDoc), XContentType.JSON));}// 3.发送请求client.bulk(request, RequestOptions.DEFAULT);// 翻页pageNo++;}
}

http://www.dtcms.com/a/520065.html

相关文章：

window安装Elasticsearch（es）

【AI编程实战】零基础用ChatGPT+Cursor开发完整Web应用：30分钟从idea到上线

亚马逊网站建设评述wordpress php环境

网站收录是什么意思最新网站网址永久发布

MySQL的增删改查

反无人机蜂群杀伤链动态构建策略研究

GCC /Clang __attribute__

阮一峰《TypeScript 教程》学习笔记——Enum 类型

人工只能综合项目开发8---手势识别data_processing

C primer plus (第六版）第十一章编程练习第13题

网站被k申述泉州专业网站建设公司

FLUMINER福禄T3 115T挖矿机深度评测：智能管理与高效性能如何平衡？

怎么调网站兼容性公益网站怎么做

压缩与缓存调优实战指南：从0到1根治性能瓶颈（四）

嵌入式软件架构--显示界面架构（工厂流水线模型，HOME界面，命令界面）

Ubuntu20.04 + QT5.14.2 + Android23的开发平台搭建总结

【思维链条CoT与React模式深度解析】AI智能体的核心推理框架

svchost第一个是rpcss第二个是termsvcs第三个是NetworkService第四个是LocalService第五个是netsvcs----备忘

餐饮网站模板免费下载jetpack wordpress

Hadoop High Availability 简介

Tier 1 供应商EDI对接：Forvia EDI需求分析

2025最新策略答案引擎优化（AEO）：在AI搜索引擎中获得更多曝光

SpringAI Redis RAG 搜索

服务器和域名都有了怎么做网站网站seo诊断分析报告

SpringBoot的Web开发

基于springboot的大创管理系统开发与设计

GitHub 热榜项目 - 日榜(2025-10-23)

RAG：让大模型“既懂又查”的智能系统

cms网站建设的优缺点wordpress两个站合并

数据结构——B树及其基本操作