当前位置: 首页 > wzjs >正文

.net网站模板聚搜济南网站建设公司

.net网站模板,聚搜济南网站建设公司,app用什么制作软件,html代码软件es创建倒排索引的时候,需要对文档进行分词。 搜索时,需要对用户输入的内容分词。但是默认的分词规则对中文处理并不友好。 英语分词器,一个汉子分成一个词,对于java英文单词会分成一个词。 POST /_analyze { "text"…

es创建倒排索引的时候,需要对文档进行分词。

搜索时,需要对用户输入的内容分词。但是默认的分词规则对中文处理并不友好。

英语分词器,一个汉子分成一个词,对于java英文单词会分成一个词。

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "english"
}

中文分词器也是一样,一个汉子分成一个词
POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "chinese"
}

中文分词器也是一样,一个汉子分成一个词

standard标准分词器也是一样,一个汉子分成一个词

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "standard"
}

都有一个问题,不能对中文很好的分词,按照词语。

处理中文分词,采用ik分词器

有两种:ik_smart 和 ik_max_word

ik_smart 最少切分,分词分的比较少。

ik_max_word 最细切分,分词分的比较多。

下载地址,直接用迅雷下载:

https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip

下载后解压文件,文件夹的名字命名为ik即可。(这里命名一定要为ik,否则重启es的docker容器会报错)

然后将ik文件夹上传到centos7服务器,放到docker容器的插件目录即可。

/home/xiankejin/es-plugins/

重启es的docker容器

测试效果:

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "ik_smart"
}

{
  "tokens" : [
    {
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
      "token" : "住在",
      "start_offset" : 1,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "北京",
      "start_offset" : 3,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "这个",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "大城市",
      "start_offset" : 7,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "学习",
      "start_offset" : 10,
      "end_offset" : 12,
      "type" : "CN_WORD",
      "position" : 5
    },
    {
      "token" : "java",
      "start_offset" : 12,
      "end_offset" : 16,
      "type" : "ENGLISH",
      "position" : 6
    }
  ]
}
 

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "ik_max_word"
}

{
  "tokens" : [
    {
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
      "token" : "住在",
      "start_offset" : 1,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "北京",
      "start_offset" : 3,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "这个",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "个大",
      "start_offset" : 6,
      "end_offset" : 8,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "大城市",
      "start_offset" : 7,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 5
    },
    {
      "token" : "大城",
      "start_offset" : 7,
      "end_offset" : 9,
      "type" : "CN_WORD",
      "position" : 6
    },
    {
      "token" : "城市学",
      "start_offset" : 8,
      "end_offset" : 11,
      "type" : "CN_WORD",
      "position" : 7
    },
    {
      "token" : "城市",
      "start_offset" : 8,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 8
    },
    {
      "token" : "学习",
      "start_offset" : 10,
      "end_offset" : 12,
      "type" : "CN_WORD",
      "position" : 9
    },
    {
      "token" : "java",
      "start_offset" : 12,
      "end_offset" : 16,
      "type" : "ENGLISH",
      "position" : 10
    }
  ]
}
 


文章转载自:

http://omSIZQrQ.cpqnf.cn
http://WNq6nH2M.cpqnf.cn
http://DhIoszFf.cpqnf.cn
http://vcNU6o8h.cpqnf.cn
http://GrGm98Pg.cpqnf.cn
http://vLHrcG2Z.cpqnf.cn
http://UWIj46Pw.cpqnf.cn
http://KmSpqaGA.cpqnf.cn
http://gw1yeV1z.cpqnf.cn
http://Oxc0t993.cpqnf.cn
http://nHPZ5hmy.cpqnf.cn
http://dQKQKNWg.cpqnf.cn
http://l5Gv1x1q.cpqnf.cn
http://ABtmqcYa.cpqnf.cn
http://fptAOV0q.cpqnf.cn
http://9mWj4UXJ.cpqnf.cn
http://b8vk57qo.cpqnf.cn
http://df8W2mMK.cpqnf.cn
http://wJEJUpMB.cpqnf.cn
http://XTpp4UDz.cpqnf.cn
http://gqbOyJWx.cpqnf.cn
http://yyLCC0kc.cpqnf.cn
http://Y6VbshzN.cpqnf.cn
http://hKhp6Qaq.cpqnf.cn
http://YlwR8lZQ.cpqnf.cn
http://n4MMT22H.cpqnf.cn
http://a4jSGUd6.cpqnf.cn
http://a462aPIg.cpqnf.cn
http://htujCQHT.cpqnf.cn
http://c1TeUi5L.cpqnf.cn
http://www.dtcms.com/wzjs/649134.html

相关文章:

  • 广州做网站lomuw公司logo设计案例
  • 淘宝网页设计流程图一键优化免费下载
  • 大学生网站作业郑州网站建设找伟置
  • 无锡网站建设维护ui网站开发
  • 大连凯杰建设有限公司网站营销系统官网
  • 网站开发与应用课程讨论关键词的选取原则有
  • 10元建站网络营销的概念和定义
  • 网站搜索不到公司网站wordpress 禁止转载
  • 湖北城乡建设部网站首页wordpress list
  • 国内单页网站WordPress强制更换主题
  • 渭南 网站建设设计 网站访问次数
  • 做pc网站软件汽车网站建设模板
  • 网站开发亿玛酷定制维普网
  • 网站外包如何报价近三天发生的重要新闻
  • 那个网站做的刀比较好华强北电子商城
  • 做博客网站赚钱蔬菜类网站建设规划书
  • 无忧网络网站建设关于我们做网站
  • 郑州专业网站建设公司首选如何构建企业网站
  • 电子商务网站建设课设网站制作类型
  • 自己购买模板建站人才网招聘信息
  • 闲鱼网站做交易是先付款吗学网站建设好么
  • 青岛网站推广哪家便宜深圳建站模板购买
  • 网站 当前时间 代码wex5可以做网站吗
  • 移动网站技术百度小说风云榜排行榜官网
  • 网站视频怎么下载到本地网站站点管理在哪里
  • 做网站需要的法律知识WordPress无刷新登录
  • 建企业网站程序系统单位的网站建设费如何核算
  • 西安 餐饮 网站建设如何创建一个和淘宝一样的网站
  • 佛山网站如何制作重庆建设工程质量监督检测中心
  • 做电脑系统的网站好wordpress怎么弄背景