当前位置: 首页 > wzjs >正文

百度收录好最快的网站排名优化工具

百度收录好最快的网站,排名优化工具,互联网装饰公司,http://www.zzy.cn 的域名管理网站es创建倒排索引的时候,需要对文档进行分词。 搜索时,需要对用户输入的内容分词。但是默认的分词规则对中文处理并不友好。 英语分词器,一个汉子分成一个词,对于java英文单词会分成一个词。 POST /_analyze { "text"…

es创建倒排索引的时候,需要对文档进行分词。

搜索时,需要对用户输入的内容分词。但是默认的分词规则对中文处理并不友好。

英语分词器,一个汉子分成一个词,对于java英文单词会分成一个词。

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "english"
}

中文分词器也是一样,一个汉子分成一个词
POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "chinese"
}

中文分词器也是一样,一个汉子分成一个词

standard标准分词器也是一样,一个汉子分成一个词

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "standard"
}

都有一个问题,不能对中文很好的分词,按照词语。

处理中文分词,采用ik分词器

有两种:ik_smart 和 ik_max_word

ik_smart 最少切分,分词分的比较少。

ik_max_word 最细切分,分词分的比较多。

下载地址,直接用迅雷下载:

https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip

下载后解压文件,文件夹的名字命名为ik即可。(这里命名一定要为ik,否则重启es的docker容器会报错)

然后将ik文件夹上传到centos7服务器,放到docker容器的插件目录即可。

/home/xiankejin/es-plugins/

重启es的docker容器

测试效果:

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "ik_smart"
}

{
  "tokens" : [
    {
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
      "token" : "住在",
      "start_offset" : 1,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "北京",
      "start_offset" : 3,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "这个",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "大城市",
      "start_offset" : 7,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "学习",
      "start_offset" : 10,
      "end_offset" : 12,
      "type" : "CN_WORD",
      "position" : 5
    },
    {
      "token" : "java",
      "start_offset" : 12,
      "end_offset" : 16,
      "type" : "ENGLISH",
      "position" : 6
    }
  ]
}
 

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "ik_max_word"
}

{
  "tokens" : [
    {
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
      "token" : "住在",
      "start_offset" : 1,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "北京",
      "start_offset" : 3,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "这个",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "个大",
      "start_offset" : 6,
      "end_offset" : 8,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "大城市",
      "start_offset" : 7,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 5
    },
    {
      "token" : "大城",
      "start_offset" : 7,
      "end_offset" : 9,
      "type" : "CN_WORD",
      "position" : 6
    },
    {
      "token" : "城市学",
      "start_offset" : 8,
      "end_offset" : 11,
      "type" : "CN_WORD",
      "position" : 7
    },
    {
      "token" : "城市",
      "start_offset" : 8,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 8
    },
    {
      "token" : "学习",
      "start_offset" : 10,
      "end_offset" : 12,
      "type" : "CN_WORD",
      "position" : 9
    },
    {
      "token" : "java",
      "start_offset" : 12,
      "end_offset" : 16,
      "type" : "ENGLISH",
      "position" : 10
    }
  ]
}
 

http://www.dtcms.com/wzjs/41043.html

相关文章:

  • 网站搭建供应商广州网络推广平台
  • 北京网站优化企业惠州seo优化服务
  • 太原网页设计最新招聘信息网站seo 工具
  • 网络运维工程师任职要求惠州seo按天计费
  • 织梦网站后台管理教程关键词排名优化教程
  • 汉川网站建设私人网站服务器
  • seo优化要做什么长春网站优化服务
  • php做的网站如何该样式广告投放渠道
  • 想学做网站学什么教程本地网络seo公司
  • 常做网站首页的文件名免费做网站自助建站
  • 辽阳网站网站建设360广告推广平台
  • 镇江门户网站seo优化推广教程
  • 免费网站建设资讯网络营销的十大特点
  • 中山百度关键词搜索适合seo的建站系统
  • 店铺装修设计网站百度收录网址提交
  • 南昌做网站要多少钱电商网站开发
  • 徐州网站开发价位济源新站seo关键词排名推广
  • 永康网站开发公司seo黑帽有哪些技术
  • 网站url跳转代码关键词全网指数查询
  • 新疆建设厅网站查询北京网站建设公司案例
  • 前端页面设计图seo属于什么
  • 网站建设公司专业公司排名网站查询地址
  • 免费制作app的手机软件seo赚钱方式
  • 谷歌官网seo托管公司
  • 物流网个人网站建设保定网站建设方案优化
  • 成功网站案例分析百度收录技术
  • 网站设计开发方案站长统计推荐
  • 网页模板怎么做网站百度竞价排名魏则西事件分析
  • 网站设计公司哪家网站优化设计的基础是网站基本要素及每个细节的优化
  • 石家庄哪有个人建站的百度竞价推广是什么意思