当前位置: 首页 > wzjs >正文

站长平台seo北京百度推广公司

站长平台seo,北京百度推广公司,政府网站建设的有关规定,网上推广找xiala5徵基于web地址的方式实现ik分词热更新。 操作系统:win 11 es version:8.6.2 ik version:8.6.2 1、创建web服务,并提供ik查询词库接口 编写分词http url代码,返回自定义分词内容分词词库数据来自业务需求,建…

        基于web地址的方式实现ik分词热更新。

操作系统:win 11

es version:8.6.2

ik version:8.6.2


1、创建web服务,并提供ik查询词库接口

  • 编写分词http url代码,返回自定义分词内容
  • 分词词库数据来自业务需求,建议存储于业务DB,便于维护
  • 多个分词按行输出,注意中文分词编码UTF-8
  • 注意http url接口返回内容编码UTF-8
  • 设置返回header头信息 ETag 为自定义词库的hash值,若有更新则重新计算;
  • 设置返回header头信息 Last-Modified 为自定义词库最新更新的时间,注意日期格式为当前的

            源码地址 github:https://github.com/a66245753/ik-remote-dict.git

            查询扩展词url:http://127.0.0.1:8080/remoteDict/extDict

            查询停用词url:http://127.0.0.1:8080/remoteDict/stopDict 

2、ik 插件下载配置

        2.1、下载ik分词器地址:Index of:

        2.2、进入analysis-ik

        2.3、选择es对应版本 8.6.2 

        下载地址:https://release.infinilabs.com/analysis-ik/stable/elasticsearch-analysis-ik-8.6.2.zip

         2.4、在es插件目录下新建ik目录,{es-path}\plugins\ik

         2.5、将2.3下载的压缩包解压到ik目录

          2.6、在es的config下面创建analysis-ik目录,{es-path}\config\analysis-ik

          2.7、将ik目录下config里面的文件拷贝到analysis-ik目录中

           2.8、编辑 IKAnalyzer.cfg.xml,将web服务中的数据接口地址填进去

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties><comment>IK Analyzer 扩展配置</comment><!--用户可以在这里配置自己的扩展字典 --><entry key="ext_dict"></entry><!--用户可以在这里配置自己的扩展停止词字典--><entry key="ext_stopwords"></entry><!-- 用户可以在这里配置远程扩展字典  --><entry key="remote_ext_dict">http://127.0.0.1:8080/remoteDict/extDict</entry><!-- 用户可以在这里配置远程扩展停止词字典 --><entry key="remote_ext_stopwords">http://127.0.0.1:8080/remoteDict/stopDict</entry>
</properties>

3、启动es和kibana

        启动es的时候会看到加载plugin的日志和词库内容。

4、验证 

        4.1、没加“噜咪啦”分词前的解析

        4.2、加“噜咪啦”分词后的解析 

 经过测试ik读取web地址的频率是每分钟一次,暂时没找到强制刷新的方法。

索引字段与属性都属于静态设置,若后期变更历史数据需要重建索引才可生效
对历史数据无效!!!!一定要重建索引!!!!

重建索引:es 3期 第10节 如何正确使用Reindex重建索引_es reindex 原索更新正常使用-CSDN博客

配置文件含义:

IKAnalyzer.cfg.xml:配置自定义词库文件

main.dic:内置的中文词库

quantifier.dic:单位相关的词

suffix.dic:后缀词

surname.dic:中国姓氏

stopword.dic:英文停用词

preposition.dic:介词词典

http://www.dtcms.com/wzjs/527448.html

相关文章:

  • html5做的网站百度识图在线使用一下
  • 延安网站开发搜狗网址导航
  • 商标免费查询官网东莞seo黑帽培训
  • 网站建设 深圳软文营销文章
  • 什么样算网站需要备案石家庄百度seo
  • 电商网站开发过程搜一搜站长工具
  • 织梦个人网站模板网店运营推广方案
  • wordpress调用幻灯片青岛seo搜索优化
  • 公司做网站费用seo项目是什么
  • 网站建设和技术支持怎么在网上做广告
  • 接网站制作怎么打开网站
  • 如何做游戏试玩网站广州谷歌优化
  • 网站系统源码站长素材免费下载
  • 网站建设文案全国疫情高峰时间表最新
  • 私人做网站要多少钱平台交易网
  • 网上做一道题2元的网站51趣优化网络seo工程师教程
  • 网购哪个网站最好网络营销与网站推广的区别
  • 哪些域名适合营销型网站大数据培训机构排名前十
  • 做网站go和php用哪个好石家庄seo结算
  • 北京网站优化推广分析如何进入网站
  • 网页设计和网站开发有什么区别北京百度seo排名点击软件
  • 宝山青岛网站建设做seo网页价格
  • 学校网站制作多少钱百度问答seo
  • axure怎么做优酷网站5188大数据官网
  • 网站缩放代码今天重要新闻
  • 鼓楼做网站公司哪家好软件推广平台
  • 做pc端网站如何网站快速收录入口
  • 湖南做网站 地址磐石网络苏州网站建设费用
  • linux网站备份百度小说搜索风云排行榜
  • 在网站建设中要注意的问题网站搜索引擎优化方案的案例