当前位置: 首页 > news >正文

IKAnalyzer分词插件使用方法

前言

随着越来越多的大数据网站崛起,特别是一些私人网站都提供了站内搜索,有些人会用elastsearch来实现站内搜索的目的,但是一些小站并没有那么大的数据提供搜索,在安装一个 elastsearch 服务未免有点浪费?

因此,为了解决以上问题,本文章特意将 elastsearch 中的 IKAnalyzer分词插件 提取出来单独使用,不需要依赖 elastsearch 就可以使用,

使用方法也很简单,下面附上代码:

先引入pom依赖

<!--分词插件--><dependency><groupId>com.janeluo</groupId><artifactId>ikanalyzer</artifactId><version>2012_u6</version></dependency>

java代码:

package com.xd.core.common.utils;import com.google.common.collect.Lists;
import org.wltea.analyzer.core.IKSegmenter;
import org.wltea.analyzer.core.Lexeme;import java.io.IOException;
import java.io.StringReader;
import java.util.ArrayList;
import java.util.List;/*** <分词工具>** @className AnalyzerUtils* @Date 2019/1/19 17:17**/
public class AnalyzerUtils {/**** <分词>** @param content 需要分词的文章* @return java.lang.String[]*/public static List<String> participle(String content) throws IOException {//独立Lucene实现StringReader re = new StringReader(content);IKSegmenter ik = new IKSegmenter(re,true);Lexeme lex = null;List<String> words = new ArrayList<>();try {while((lex=ik.next())!=null){words.add(lex.getLexemeText());}}catch (Exception e) {e.printStackTrace();throw e;}return words;}public static void main(String[] args) throws IOException {List<String> participle = participle("如何成为一个高情商的人,心理学家玛莎.莱恩博士曾经创建了高情商训练课,从这四个方面帮助了无数人提升情商");System.out.println(participle);}}

运行结果:
[如何, 成为, 一个, 高, 情商, 的人, 心理学家, 玛莎, 莱, 恩, 博士, 曾经, 创, 建了, 高, 情商, 训练课, 从这, 四个, 方面, 帮助, 了无, 数人, 提升, 情商]

另外,如果有条件的话还是使用elastsearch 用作搜索引擎较好

http://www.dtcms.com/a/301244.html

相关文章:

  • 第十八章:AI的“通感”:揭秘图、文、音的共同语言——CLIP模型
  • 图像智能识别(一)-Python方向
  • 嵌入式学习日志————对射式红外传感器计次
  • 「iOS」————ARC
  • MyBatis-Plus 条件构造器(Wrapper)全解析
  • docker in docker - 在docker容器中使用宿主机的docker
  • mac电脑安装docker图文教程
  • Java面试全栈通关:从微服务到AI的技术深度解析
  • [10月考试] C
  • Java面试全攻略:Spring生态与微服务架构实战
  • LangChain实现RAG
  • [2025CVPR-图象超分辨方向]DORNet:面向退化的正则化网络,用于盲深度超分辨率
  • 马尔可夫链
  • 设计模式(十三)结构型:代理模式详解
  • Python 使用 asyncio 包处理并 发(避免阻塞型调用)
  • 图像智能识别算法记录
  • 动态规划 (Dynamic Programming) 算法概念-Python示例
  • Leetcode——287. 寻找重复数
  • SignalR 全解析:核心原理、适用场景与 Vue + .NET Core 实战
  • 工业控制系统安全之 Modbus 协议中间人攻击(MITM)分析与防范
  • 全面理解JVM虚拟机
  • RS485转profinet网关如何让JRT激光测距传感器开启自动模式连续测量模式
  • 淘宝获取店铺订单信息操作指南
  • Python爬虫入门:从零开始抓取网页数据
  • 每日一讲——Podman
  • 分布式事务-MQ事务消息学习与落地方案
  • 前端面试专栏-前沿技术:32.AI辅助开发工具应用
  • 0-1BFS(双端队列,洛谷P4667 [BalticOI 2011] Switch the Lamp On 电路维修 (Day1)题解)
  • 用 Flask 打造宠物店线上平台:从 0 到 1 的全栈开发实践
  • 电商项目_核心业务_数据归档