当前位置: 首页 > wzjs >正文

.net网站模板商城网站互动性

.net网站模板,商城网站互动性,互联网推广引流公司,济南专业做网站es创建倒排索引的时候,需要对文档进行分词。 搜索时,需要对用户输入的内容分词。但是默认的分词规则对中文处理并不友好。 英语分词器,一个汉子分成一个词,对于java英文单词会分成一个词。 POST /_analyze { "text"…

es创建倒排索引的时候,需要对文档进行分词。

搜索时,需要对用户输入的内容分词。但是默认的分词规则对中文处理并不友好。

英语分词器,一个汉子分成一个词,对于java英文单词会分成一个词。

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "english"
}

中文分词器也是一样,一个汉子分成一个词
POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "chinese"
}

中文分词器也是一样,一个汉子分成一个词

standard标准分词器也是一样,一个汉子分成一个词

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "standard"
}

都有一个问题,不能对中文很好的分词,按照词语。

处理中文分词,采用ik分词器

有两种:ik_smart 和 ik_max_word

ik_smart 最少切分,分词分的比较少。

ik_max_word 最细切分,分词分的比较多。

下载地址,直接用迅雷下载:

https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip

下载后解压文件,文件夹的名字命名为ik即可。(这里命名一定要为ik,否则重启es的docker容器会报错)

然后将ik文件夹上传到centos7服务器,放到docker容器的插件目录即可。

/home/xiankejin/es-plugins/

重启es的docker容器

测试效果:

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "ik_smart"
}

{
  "tokens" : [
    {
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
      "token" : "住在",
      "start_offset" : 1,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "北京",
      "start_offset" : 3,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "这个",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "大城市",
      "start_offset" : 7,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "学习",
      "start_offset" : 10,
      "end_offset" : 12,
      "type" : "CN_WORD",
      "position" : 5
    },
    {
      "token" : "java",
      "start_offset" : 12,
      "end_offset" : 16,
      "type" : "ENGLISH",
      "position" : 6
    }
  ]
}
 

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "ik_max_word"
}

{
  "tokens" : [
    {
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
      "token" : "住在",
      "start_offset" : 1,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "北京",
      "start_offset" : 3,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "这个",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "个大",
      "start_offset" : 6,
      "end_offset" : 8,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "大城市",
      "start_offset" : 7,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 5
    },
    {
      "token" : "大城",
      "start_offset" : 7,
      "end_offset" : 9,
      "type" : "CN_WORD",
      "position" : 6
    },
    {
      "token" : "城市学",
      "start_offset" : 8,
      "end_offset" : 11,
      "type" : "CN_WORD",
      "position" : 7
    },
    {
      "token" : "城市",
      "start_offset" : 8,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 8
    },
    {
      "token" : "学习",
      "start_offset" : 10,
      "end_offset" : 12,
      "type" : "CN_WORD",
      "position" : 9
    },
    {
      "token" : "java",
      "start_offset" : 12,
      "end_offset" : 16,
      "type" : "ENGLISH",
      "position" : 10
    }
  ]
}
 

http://www.dtcms.com/wzjs/587484.html

相关文章:

  • 手机网站建设步骤包装设计怎么做
  • 网站前端后端分开做可以吗网站雪花飘落代码
  • 做历史卷子的网站wordpress适应手机
  • 上虞区驿亭镇新农村建设网站手机界面设计说明
  • 盐城网站设计公司零基础是学不了ui的
  • 网站关键词seo优化怎么做微网站建设完不知道怎么推广咋办
  • 阅读小说网站建设2016网站谷歌权重
  • cms网站开发网站底部链接代码
  • wordpress建设下载网站网站建设的基本特点
  • 枣阳市建设局网站wordpress图片弹出
  • 合肥建设监理协会网站网络规划设计方案模板
  • 合江做网站营销系统软件
  • 网站建设优化汕头网站技术
  • phpcmsv9网站地图做游戏网站的需求分析
  • wordpress单页面网站怎么做安徽商会网站建设方案
  • seo的培训网站哪里好三秒自动跳转页面
  • 专门做外链的网站借用备案网站跳转做淘宝客
  • 外贸网站建设策划学做美食视频网站
  • 上海网站建设改版网页游戏平台十大排名
  • 北京高端网站制作公司广告字体设计在线生成
  • ftp网站后台wordpress首页是哪个文件
  • 如何构成网站坂田英文网站制作
  • 深圳网站制作推广闵行集团网站建设
  • 顺德微信网站建设重庆平台网站建设费用
  • 汕头模板做网站专业建站推广网络公司
  • 鞍山网站建设制作网站前后端分离怎么做
  • 网站建设题目网站关键词突然搜不到了
  • 网站制作公司拟小鱼儿企业网站管理系统
  • 建材网站长工具seo域名解析不了
  • 什么网站好建设网站可以叫做系统吗