当前位置: 首页 > wzjs >正文

.net网站模板枣庄网络推广

.net网站模板,枣庄网络推广,网页设计方案,网站开发大致需要哪些步骤es创建倒排索引的时候,需要对文档进行分词。 搜索时,需要对用户输入的内容分词。但是默认的分词规则对中文处理并不友好。 英语分词器,一个汉子分成一个词,对于java英文单词会分成一个词。 POST /_analyze { "text"…

es创建倒排索引的时候,需要对文档进行分词。

搜索时,需要对用户输入的内容分词。但是默认的分词规则对中文处理并不友好。

英语分词器,一个汉子分成一个词,对于java英文单词会分成一个词。

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "english"
}

中文分词器也是一样,一个汉子分成一个词
POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "chinese"
}

中文分词器也是一样,一个汉子分成一个词

standard标准分词器也是一样,一个汉子分成一个词

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "standard"
}

都有一个问题,不能对中文很好的分词,按照词语。

处理中文分词,采用ik分词器

有两种:ik_smart 和 ik_max_word

ik_smart 最少切分,分词分的比较少。

ik_max_word 最细切分,分词分的比较多。

下载地址,直接用迅雷下载:

https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip

下载后解压文件,文件夹的名字命名为ik即可。(这里命名一定要为ik,否则重启es的docker容器会报错)

然后将ik文件夹上传到centos7服务器,放到docker容器的插件目录即可。

/home/xiankejin/es-plugins/

重启es的docker容器

测试效果:

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "ik_smart"
}

{
  "tokens" : [
    {
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
      "token" : "住在",
      "start_offset" : 1,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "北京",
      "start_offset" : 3,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "这个",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "大城市",
      "start_offset" : 7,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "学习",
      "start_offset" : 10,
      "end_offset" : 12,
      "type" : "CN_WORD",
      "position" : 5
    },
    {
      "token" : "java",
      "start_offset" : 12,
      "end_offset" : 16,
      "type" : "ENGLISH",
      "position" : 6
    }
  ]
}
 

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "ik_max_word"
}

{
  "tokens" : [
    {
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
      "token" : "住在",
      "start_offset" : 1,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "北京",
      "start_offset" : 3,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "这个",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "个大",
      "start_offset" : 6,
      "end_offset" : 8,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "大城市",
      "start_offset" : 7,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 5
    },
    {
      "token" : "大城",
      "start_offset" : 7,
      "end_offset" : 9,
      "type" : "CN_WORD",
      "position" : 6
    },
    {
      "token" : "城市学",
      "start_offset" : 8,
      "end_offset" : 11,
      "type" : "CN_WORD",
      "position" : 7
    },
    {
      "token" : "城市",
      "start_offset" : 8,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 8
    },
    {
      "token" : "学习",
      "start_offset" : 10,
      "end_offset" : 12,
      "type" : "CN_WORD",
      "position" : 9
    },
    {
      "token" : "java",
      "start_offset" : 12,
      "end_offset" : 16,
      "type" : "ENGLISH",
      "position" : 10
    }
  ]
}
 


文章转载自:

http://H7IcPoFe.dbrdg.cn
http://SlsuW7pL.dbrdg.cn
http://oddNhUxF.dbrdg.cn
http://wCcraUPK.dbrdg.cn
http://XMoHtW78.dbrdg.cn
http://zV14QXDT.dbrdg.cn
http://sXCbTXsZ.dbrdg.cn
http://YLEflmUA.dbrdg.cn
http://YTYmMFVb.dbrdg.cn
http://I3MUytXG.dbrdg.cn
http://A9Zrti0S.dbrdg.cn
http://DyRhJJGp.dbrdg.cn
http://bGve0kVj.dbrdg.cn
http://fa5pBcj1.dbrdg.cn
http://qhtqwCCc.dbrdg.cn
http://9DnWbRT8.dbrdg.cn
http://XBeScmtd.dbrdg.cn
http://4Ac6CJBY.dbrdg.cn
http://HH1nagRW.dbrdg.cn
http://qmMybnTO.dbrdg.cn
http://znM0djhX.dbrdg.cn
http://u8MyszHd.dbrdg.cn
http://IfJbwJsG.dbrdg.cn
http://wy8eoNuA.dbrdg.cn
http://MJtq21ck.dbrdg.cn
http://kpjnkYy5.dbrdg.cn
http://34J1rWF4.dbrdg.cn
http://QpPQmRjx.dbrdg.cn
http://4zAzmlpO.dbrdg.cn
http://3Lxbn4Ql.dbrdg.cn
http://www.dtcms.com/wzjs/672934.html

相关文章:

  • 网站建设与运营 好考吗怎么免费建立自己的网站平台
  • 东莞公司网站做优化沐风+wordpress+主题
  • 站长推荐产品sae做的网站备份
  • 效益型网站互联网公司排名去哪里看
  • 网站建设可行性分析表wordpress带数据
  • 自己做网站麻烦吗广告灯箱设计制作价格
  • 贵州省住房城乡建设厅网站会网站开发没学历
  • 清远市清城区网站建设公司公司网站营销
  • 网站标题替换WordPress插件代码化
  • 重庆网站建设选圣矢河北关键词搜索排名公司
  • 任务平台网站建设张家港市住房城乡建设局网站
  • 网站名和域名深圳做网站做得比较好的公司
  • 吴江手机网站建设价格软文代写价格
  • 无锡高端网站建设平台网站开发获客渠道
  • 鹿城做网站wordpress客户端开发
  • 有偿做设计的网站网页模版是已经做好的
  • 查网站是否备案能源建设投资有限公司网站
  • 网站屏蔽中国ip自助建站 源码
  • 做品牌特价的网站礼品网站建设公司
  • 网站的用户体验苏州首页排名关键词优化
  • 网站用户注册页面怎么做静态网页是什么意思
  • 麦当劳的网站优化建议电子商务网站建设的展望
  • 网站建设标书样本网站备案必须做前置审批吗
  • 手机网站图片滑动网站的可用性
  • 长宁区网站建设开发公司网站生成二维码
  • 天津网站建设举措一加官网
  • 国外免费推广网站网站建设服务费如何做会计分录
  • 网站开发工作总结东莞教育团购网站建设
  • 建立网站需要多长钱大朗做网站
  • 广东建设监理协会网站题库浙江省旅游企业网站建设情况