当前位置: 首页 > news >正文

Elasticsearch 7.6 安装 Jieba 中文分词插件完整教程

Elasticsearch 7.6 安装 Jieba 中文分词插件完整教程

    • 一. 前置准备
    • 二. 安装 Gradle
      • 2.1 下载 Gradle
      • 2.2 配置环境变量
    • 三. 下载 Elasticsearch-jieba 插件源码
    • 四. 构建插件
    • 五. 修改插件版本(可选)
    • 六 测试

前言
这是我在这个网站整理的笔记,有错误的地方请指出,关注我,接下来还会持续更新。

作者:神的孩子都在歌唱

推荐文章:es开源小工具 – 分析器功能

Elasticsearch 默认的分析器对中文支持不好,jieba 分词插件是最常用的中文分词方案之一。本文将详细介绍在 Elasticsearch 7.6 上安装、构建、使用 jieba 插件的完整流程,包括 Gradle 安装、源码构建、插件安装和使用示例

一. 前置准备

  • 系统:CentOS 7
  • Elasticsearch 版本:7.6.1
  • Java 版本:JDK 8~ 11+
  • 工具:Gradle(用于构建插件)

注意:Elasticsearch 不能以 root 用户运行,需要创建专用用户。

sudo useradd -r -s /sbin/nologin elasticsearch

将 Elasticsearch 目录属主改为 elasticsearch 用户:

sudo chown -R elasticsearch:elasticsearch /chen/env/elasticsearch-7.6.1

二. 安装 Gradle

Elasticsearch-jieba 插件源码需要 Gradle 构建。由于国内访问 Gradle 官方下载慢,推荐使用 国内镜像

2.1 下载 Gradle

cd /tmp
wget https://mirrors.aliyun.com/gradle/gradle-4.10.3-bin.zip
sudo mkdir -p /chen/env/gradle
sudo unzip gradle-4.10.3-bin.zip -d /chen/env/gradle

或者手动下载上传也可以

2.2 配置环境变量

记得修改地址路径

echo 'export GRADLE_HOME=/chen/env/gradle/gradle-4.10.3' >> ~/.bashrc
echo 'export PATH=$GRADLE_HOME/bin:$PATH' >> ~/.bashrc
source ~/.bashrc

验证安装:

gradle -v

在这里插入图片描述

三. 下载 Elasticsearch-jieba 插件源码

使用国内镜像 Gitee 加快下载:

cd /root
git clone https://gitee.com/mirrors/elasticsearch-jieba-plugin.git
cd elasticsearch-jieba-plugin
git checkout 7.4.2   # 切换到与 ES 7.6 对应的版本

也可以手动下载:
gitee

github

四. 构建插件

gradle pz

在这里插入图片描述

构建完成后,会在以下目录 生成 zip 文件:

build/distributions/elasticsearch-jieba-plugin-7.6.1.zip

在这里插入图片描述

如果报错 Could not get unknown property 'runtime',说明 Gradle 版本过高,需要切换到 4.x 或 5.x。

然后将插件放入es的plugins目录,解压

cp elasticsearch-jieba-plugin-7.4.2.zip /chen/env/elasticsearch-7.6.1/plugins/
unzip elasticsearch-jieba-plugin-7.4.2.zip -d analysis-jieba

在这里插入图片描述

五. 修改插件版本(可选)

启动时会报 Plugin was built for Elasticsearch version 7.4.2 but 7.6.1 is running

在这里插入图片描述

如果遇到插件标注的版本和 ES 不匹配,可修改,博主就遇到了这个问题,所以也是折腾了一会才知道:

cd build/distributions/elasticsearch-jieba-plugin-7.6.1
vim plugin-descriptor.properties

修改 elasticsearch.version=7.4.2 为:

elasticsearch.version=7.6.1

在这里插入图片描述
然后在重启es就可以了

六 测试

安装完成后,重启es,检查插件是否安装成功:

curl -X GET "localhost:9200/_cat/plugins?v"

示例输出:

在这里插入图片描述

以上结果是我用的我自己的开发的es小工具输出的,大家感兴趣可以去看看,代码完全开源,对日常工作和学习都是挺不错的。完整代码连接 github 对你有帮助记得点赞收藏,es开源小工具 – 分析器功能

使用结巴分词查询

{{url}}/_analyze
{"analyzer": "jieba_index","text": "你好呀"
}

在这里插入图片描述

作者:神的孩子都在歌唱

本人博客:https://blog.csdn.net/weixin_46654114

转载说明:务必注明来源,附带本人博客连接。

http://www.dtcms.com/a/601384.html

相关文章:

  • OpenCV 加载时出现 `no opencv_java451 in java.library.path` 错误
  • 【CCF-CSP】05-02日期计算
  • 如何实施网站推广wordpress您的密码重设链接无效
  • GlobalFoundries从台积电获得GaN技术许可
  • ModelEngine 智能体开发实战:2 个月 3 个项目从知识库到多 Agent 协作完整指南
  • TensorFlow深度学习实战(43)——TensorFlow.js
  • 异世界传奇:OSPF王国与链路状态信使协议
  • IB 比 RoCE 更快的底层逻辑-深度拆解
  • LangWBC:基于端到端学习的语言导向型人形机器人全身控制
  • 网站建设 国外无需下载的网站
  • 技术支持 贵阳贵阳网站建设wordpress主题图片
  • 域名注册商怎么查南宁优化网站网络服务
  • 文山城乡建设部网站首页东莞做网站优化
  • CSS 动画与变换属性详解
  • 11.12 LeetCode 题目汇总与解题思路
  • 【代码审计】RuoYi-4.7.34.7.8 定时任务RCE 漏洞分析
  • 数学图论的艺术:解码最小公倍数图中的连通奥秘
  • 如何有效解决Windows 11界面卡顿问题,提升操作流畅度
  • 网站开发iso9001有哪些网页游戏网站
  • nginx安装配置、故障处置、性能优化
  • 网上商城互联网网站开发网站建设流程效果
  • 商品案例-组件封装(vue)
  • 新视角看 js 的数据类型
  • PySide6 + QML - QSerialPort01 - 扫描操作系统上有效的串口
  • 【前端面试】HTML篇
  • Next.js第四章(路由导航)
  • 从jsp打开一个html,怎么把jsp的某些参数传递给html
  • 谷歌google官方网站网站开发 书籍
  • 北京网站备案公司安徽观元建设有限公司网站
  • 若依plus请求加解密