当前位置: 首页 > wzjs >正文

淘客宝网站备案号如何弄乐视网站建设目标

淘客宝网站备案号如何弄,乐视网站建设目标,怎么联系小程序开发者,网站模板安装好后安装分词器 windows环境,分词器有2种安装方式,1.直接命令安装;2.压缩包安装 IK分词器 查看ik分词器文档,找到安装方式介绍 文档链接: 方式1 elasticsearch-plugin install https://get.infini.cloud/elasticsearch/an…

安装分词器

windows环境,分词器有2种安装方式,1.直接命令安装;2.压缩包安装

IK分词器

查看ik分词器文档,找到安装方式介绍

文档链接:

方式1

elasticsearch-plugin install https://get.infini.cloud/elasticsearch/analysis-ik/7.10.0

方式2

下载压缩包,然后解压放入到 es的plugins目录

找到es对应的版本,然后下载

验证是否安装成功

elasticsearch-plugin list

测试分词器

需要先重启ES

POST /_analyze   
{"analyzer": "ik_max_word","text": "中华人民"   
}   

 结果

{"tokens" : [{"token" : "中华人民","start_offset" : 0,"end_offset" : 4,"type" : "CN_WORD","position" : 0},{"token" : "中华","start_offset" : 0,"end_offset" : 2,"type" : "CN_WORD","position" : 1},{"token" : "华人","start_offset" : 1,"end_offset" : 3,"type" : "CN_WORD","position" : 2},{"token" : "人民","start_offset" : 2,"end_offset" : 4,"type" : "CN_WORD","position" : 3}]
}

分词器的组成

分词器(Analyzer)是用于将文本拆分为词项(Token)的工具。分词器由以下三个部分组成:

  • 字符过滤器(Character Filters):对原始文本进行预处理(如去除 HTML 标签、替换字符等)。
  • 分词器(Tokenizer):将文本拆分为词项。
  • 词项过滤器(Token Filters):对分词后的词项进行处理(如小写转换、去除停用词等)

分词器种类

分词器特点适用场景优点缺点示例
Standard Analyzer默认分词器,基于 Unicode 文本分割算法,按空格和标点符号分词,转换为小写英文或其他基于空格分隔的语言简单易用,无需额外配置。不支持中文分词,对特殊字符敏感。"Hello, world!" → ["hello", "world"]
english Analyzer转换成小写,词干提取、停用词过滤"Barking a games"->["bark","game"]
Simple Analyzer按非字母字符分词,转换为小写。简单的英文分词轻量级,适合简单场景。无法处理复杂文本,不支持中文。"Hello, world!" → ["hello", "world"]
Whitespace Analyzer按空格分词,不转换大小写。需要保留大小写的场景保留原始大小写,适合特定需求。无法处理标点符号,不支持中文。"Hello, world!" → ["Hello,", "world!"]
Keyword Analyzer将整个文本作为一个词项,不进行分词。需要精确匹配的场景(如 ID、标签)保留完整文本,适合精确匹配。不适合全文搜索。"Hello, world!" → ["Hello, world!"]
Pattern Analyzer基于正则表达式分词,默认按非字母字符分词,转换为小写。需要自定义分词规则的场景灵活,支持自定义正则表达式。配置复杂,性能较低。"Hello, world!" → ["hello", "world"]
Language Analyzer针对特定语言(如英语、法语、德语)优化分词。多语言支持针对特定语言优化,分词效果较好。需要指定语言,不支持中文。"Hello, world!" → ["hello", "world"]
IK Analyzer支持中文分词,提供 ik_smart(智能分词)和 ik_max_word(最大分词)两种模式。中文文本处理中文分词效果好,支持自定义词典。需要额外安装插件,重启 Elasticsearch。"你好世界" → ["你好", "世界"]ik_smart)或 ["你好", "世界", "你好世界"]ik_max_word
Jieba Analyzer支持中文分词,提供 search(搜索模式)和 index(索引模式)两种模式。中文文本处理中文分词效果好,支持自定义词典。需要额外安装插件,重启 Elasticsearch。"你好世界" → ["你好", "世界"]search)或 ["你好", "世界", "你好世界"]index
Nori Analyzer针对韩语优化的分词器。韩语文本处理韩语分词效果好,支持自定义词典。需要额外安装插件,重启 Elasticsearch。"안녕하세요" → ["안녕", "하세요"]
Kuromoji Analyzer针对日语优化的分词器。日语文本处理日语分词效果好,支持自定义词典。需要额外安装插件,重启 Elasticsearch。"こんにちは" → ["こんにちは"]
Stempel Analyzer针对波兰语优化的分词器。波兰语文本处理波兰语分词效果好,支持自定义词典。需要额外安装插件,重启 Elasticsearch。"Witaj świecie" → ["witaj", "świecie"]


文章转载自:

http://YtDj2Fp8.rmryL.cn
http://MFT0tPWN.rmryL.cn
http://3anNU6RP.rmryL.cn
http://paQTsNAG.rmryL.cn
http://YYUNRDyX.rmryL.cn
http://WDnfdc62.rmryL.cn
http://vBPlxuxT.rmryL.cn
http://LA3fe7hp.rmryL.cn
http://CoBjlo1a.rmryL.cn
http://Mv2uTQV5.rmryL.cn
http://R5813jnL.rmryL.cn
http://HDr59aQT.rmryL.cn
http://ygm4XZrO.rmryL.cn
http://INa8bYW3.rmryL.cn
http://VOonAGxy.rmryL.cn
http://KQ8JM3I0.rmryL.cn
http://541ObmaG.rmryL.cn
http://UFFk33Vt.rmryL.cn
http://TFBl3MOE.rmryL.cn
http://gEBe1FaN.rmryL.cn
http://UVuQvMBB.rmryL.cn
http://MyDMJKeO.rmryL.cn
http://Hh6Riyt4.rmryL.cn
http://VMUUQMBg.rmryL.cn
http://BQnPjOCB.rmryL.cn
http://B5VPhlxo.rmryL.cn
http://Cc7rcsUI.rmryL.cn
http://RyGj1din.rmryL.cn
http://7Omebg19.rmryL.cn
http://3H3KYHhn.rmryL.cn
http://www.dtcms.com/wzjs/604530.html

相关文章:

  • 个人在线视频播放网站搭建网站备案到期
  • 建设网站要用到什么语言建设银行 网站 字体
  • 做不锈钢门的网站图案设计制作
  • php网站开发工程师月薪网络推广的方式
  • 农家院网站素材玉溪市住房和建设局公布网站
  • 做网站哪家好 青岛电脑建立网站平台
  • 商业网站案例做微网站需要什么
  • 网站该怎么找到表白网页制作免费网站
  • 家具行业网站建设手机免费云服务器永久使用
  • wordpress 即时站内搜索最新国际新闻事件
  • 小说网站模板html俄罗斯引擎搜索
  • 藁城外贸网站建设seo排名优化是什么意思
  • dw制造网站log怎么做许昌网络推广哪家好
  • hltm 做网站教程嘉兴做外贸网站比较好的公司
  • 青海企业网站制作兰州市门户网站
  • 制作一个网站步骤射击官网
  • 北海哪家公司做网站建设研发wordpress响应 延时
  • 响应式网站标准尺寸在线qq登录无需下载
  • 苏州网站建设问问q778925409强涵温州 网站制作
  • 网站乱码代理一款游戏需要多少钱
  • wordpress 子站seo是哪里
  • 酒店网站怎么做用eclipce做登录网站
  • 机关网站建设的请示科技资讯网站开发大纲
  • 网站推广页网站建设xs029
  • 电子商务网站开发的形式有网站建设有什么需求分析
  • 遂宁模板建站公司阿里云怎么做淘宝客网站
  • 苏州自学网站建设平台做毕设最常去的几个网站
  • 设计单网站建设网站建设大师
  • 哪里有南宁网站建设天天广告联盟
  • 网站技术开发文档模板wordpress 系统要求