当前位置: 首页 > wzjs >正文

建网站做优化企业官网和小程序的区别

建网站做优化,企业官网和小程序的区别,wordpress退出维护模式,公司注册大概多少钱Easysearch 1.10 版本在 IK 词典部分增加了字段级别词典的功能。 字段级别词典的功能支持用户对不同的字段设置不同的分词词库,用户既可以完全使用自己的词库,也支持在 ik 默认的词库上增加自定义的词库内容。 在整体使用上,ik 自定义词库的…

Easysearch 1.10 版本在 IK 词典部分增加了字段级别词典的功能。

字段级别词典的功能支持用户对不同的字段设置不同的分词词库,用户既可以完全使用自己的词库,也支持在 ik 默认的词库上增加自定义的词库内容。

在整体使用上,ik 自定义词库的设计是比较灵活的,用户不仅可以通过分词器设置,自由的应用到各个字段。存储词典的方式也从固定文件和远程连接修改成了读取本地集群中默认的词库索引,减少了自定义词库的配置成本。当然,这个词库索引也可以由用户自定义,只要能和默认的词库索引保持一样的结构就好。

好了,现在让我们具体看一下 ik 字段级别词典的使用方法吧。

词库存储位置

默认的词库索引是 .analysis_ik 索引,IK 插件自动初始化的 .analysis_ik 索引。

用户可以自定义使用某个索引替代 .analysis_ik(设置参数下面会提及),但是要保持和 .analysis_ik 一个的 mapping 结构和使用同一个 pipeline。

.analysis_ik 词库需要存储的格式如下:

POST .analysis_ik/_doc
{"dict_key": "test_dic","dict_type": "main_dicts","dict_content":   "dict_content": """中华人民共和国
中文万岁
秋水共长天"""
}

主要使用字段

  • dict_content:词典内容字段。各个词典以换行符分隔。
  • dict_key:自定义词典名。对应自定义词典中设置的 dict_key。
  • dict_type:字典类型,可选 “main_dicts”, “stopwords_dicts”, “quantifier_dicts” 三个值。其中任意 dict_key 的"main_dicts"必须存在。

如何使用自定义词库

自定义词库的生效主要通过自定义 tokenizer 进行设置。

PUT my-index-000001
{"settings": {"analysis": {"analyzer": {"my_custom_analyzer": {"type": "custom","tokenizer": "my_tokenizer"}},"tokenizer": {"my_tokenizer": {"type": "ik_max_word","custom_dict_enable": true,"load_default_dicts":true,"lowcase_enable": true,"dict_key": "test_dic","dict_index":"custom_index"}}}},"mappings": {"properties": {"test_ik": {"type": "text","analyzer": "my_custom_analyzer"}}}
}

其中

  • custom_dict_enable:布尔值,默认 false,true 则可以定制词典读取路径,否则 load_default_dicts / dict_key / dict_index 均失效。
  • load_default_dicts:布尔值,默认 true,定制的词典是否包含默认的词典库。
  • lowcase_enable:布尔值,默认为 true,是否大小写敏感,false 则保留原来文本的大小写。
  • dict_key:string。对应词库索引中的 dict_key 字段内容。如果词典名不匹配,则会装载错误或者直接报错
  • dict_index: string。词库索引名称,默认是 .analysis_ik。可以自定义,但是要保持和 mapping 结构以及 pipeline 一致。

词库内容怎么更新

词库现阶段只接受追加内容,没有删除词库数据的功能。如果在同一条数据上进行修改则也被视为追加。暂时不建议对词库内容进行删除或者修改,可能会造成节点间词库的混乱**。**

词库的追加内容是能自动被程序探测的,这个主要依赖于 .analysis_ik 的时间戳字段和 pipeline 执行。

# 词典索引写入需要的默认时间戳 pipeline
GET _ingest/pipeline/ik_dicts_default_date_pipeline
{"ik_dicts_default_date_pipeline": {"processors": [{"set": {"field": "upload_dicts_timestamp","value": "{{_ingest.timestamp}}","override": true}}]}
}# 词典索引的结构
GET .analysis.ik
{".analysis.ik": {"aliases": {},"mappings": {"properties": {"dict_content": {"type": "text","analyzer": "custom_analyzer"},"dict_key": {"type": "keyword"},"dict_type": {"type": "keyword"},"upload_dicts_timestamp": {"type": "date"}}},"settings": {"index": {"number_of_shards": "1","provided_name": ".analysis.ik","default_pipeline": "ik_dicts_default_date_pipeline","creation_date": "1738910858601","analysis": {"analyzer": {"custom_analyzer": {"type": "custom","tokenizer": "pattern_tokenizer"}},"tokenizer": {"pattern_tokenizer": {"pattern": "\n","type": "pattern"}}},"number_of_replicas": "1","uuid": "bmBY_qf3TpW_Qyw_1tOq2Q","version": {"created": "1090199"}}}}
}

这里 ik_dicts_default_date_pipeline 会对每一条写入词库的数据赋予当前 upload_dicts_timestamp 时间戳。ik 会记录当前词库的最大时间戳,然后每分钟都会去查询一次词库索引现有的最大时间戳。如果查到词库索引的最大的时间戳大于上次记录到的时间戳,则对这段时间内的词库内容都进行加载。

代码样例

测试词典数据

POST .analysis_ik/_doc
{"dict_key": "test_dic","dict_type": "main_dicts","dict_content": """中华人民共和国中文万岁秋水共长天"""
}

测试索引

PUT my-index-000001
{"settings": {"analysis": {"analyzer": {"my_custom_analyzer": {"type": "custom","tokenizer": "my_tokenizer"}},"tokenizer": {"my_tokenizer": {"type": "ik_max_word","custom_dict_enable": true,"load_default_dicts":false,"lowcase_enable": true,"dict_key": "test_dic"}}}},"mappings": {"properties": {"test_ik": {"type": "text","analyzer": "my_custom_analyzer"}}}
}

分词测试

POST my-index-000001/_analyze
{"field": "test_ik","text": ["中华人民共和国 中文万岁 秋水共长天"]
}
# 返回结果
{"tokens": [{"token": "中华人民共和国","start_offset": 0,"end_offset": 7,"type": "CN_WORD","position": 0},{"token": "中文万岁","start_offset": 8,"end_offset": 12,"type": "CN_WORD","position": 1},{"token": "万","start_offset": 10,"end_offset": 11,"type": "TYPE_CNUM","position": 2},{"token": "岁","start_offset": 11,"end_offset": 12,"type": "CN_CHAR","position": 3},{"token": "秋水共长天","start_offset": 13,"end_offset": 18,"type": "CN_WORD","position": 4}]
}

测试未加载的词典

追加词典数据

POST .analysis_ik/_doc
{"dict_key": "test_dic","dict_type": "main_dicts","dict_content": "极限科技"
}

测试新加载的词典

好了,以上就是 ik 字段级别词典的主要功能,具体内容欢迎大家使用。

关于 Easysearch

INFINI Easysearch 是一个分布式的搜索型数据库,实现非结构化数据检索、全文检索、向量检索、地理位置信息查询、组合索引查询、多语种支持、聚合分析等。Easysearch 可以完美替代 Elasticsearch,同时添加和完善多项企业级功能。Easysearch 助您拥有简洁、高效、易用的搜索体验。

官网文档:https://infinilabs.cn/docs/latest/easysearch

作者:金多安,极限科技(INFINI Labs)搜索运维专家,Elastic 认证专家,搜索客社区日报责任编辑。一直从事与搜索运维相关的工作,日常会去挖掘 ES / Lucene 方向的搜索技术原理,保持搜索相关技术发展的关注。


文章转载自:

http://oYdMuQvD.qykss.cn
http://lJCwTviw.qykss.cn
http://YcSUYdCY.qykss.cn
http://36OzIkt2.qykss.cn
http://iBO04crH.qykss.cn
http://OAtabKRy.qykss.cn
http://i0GBqiIb.qykss.cn
http://6j1MXPdY.qykss.cn
http://csfIxrpq.qykss.cn
http://giw7D8FS.qykss.cn
http://hfBpIuIO.qykss.cn
http://AD7YMlId.qykss.cn
http://x6w7vt5w.qykss.cn
http://xUQWpGC5.qykss.cn
http://5ESHX7LQ.qykss.cn
http://7jSFJ3jr.qykss.cn
http://sj7lrHz0.qykss.cn
http://tZ7ZvsVC.qykss.cn
http://Xl69SM5z.qykss.cn
http://ddeRBZlA.qykss.cn
http://aEHgaYyg.qykss.cn
http://BrD2dSI8.qykss.cn
http://7wsl7DFE.qykss.cn
http://iqFMOlrI.qykss.cn
http://MMV9dvb7.qykss.cn
http://suyZssOW.qykss.cn
http://iHqh6Phx.qykss.cn
http://5yv2mA7d.qykss.cn
http://hA6Xiqwc.qykss.cn
http://683szilh.qykss.cn
http://www.dtcms.com/wzjs/694342.html

相关文章:

  • 网站开发如何共用菜单栏require网站申请微信支付接口
  • 做网站的模版马克飞象 wordpress
  • 网站怎么seo关键词排名优化推广手机上怎么上传网站
  • 建站公司那家好网站后台上传图片 不可用
  • 格朗图手表网站如何建立一个网站卖货
  • 站长之家站长工具php网站建设教程视频
  • 网站建设运营维护啥意思常州网站建设市场
  • 行业网站源码网站建设公司86215
  • 组织网站建设应该注意什么如何做exo网站
  • 海曙区建设局网站建电影网站赚钱挣钱吗
  • 网站如何三合一wordpress 菜单居中
  • 一个网站的成功网站首页图片代码
  • 网站后台发邮件做外贸怎样浏览国外网站
  • 佛山新网站建设服务知名品牌设计logo解析
  • php 建设网站网站语言有几种
  • 教育网站解决方案怎么提高网站加载速度
  • 懒人之家网站模板php网站开发技术
  • 华能集团网站建设方案项目分析诸城网站建设0536s
  • 手机网站的优缺点vps一定要Wordpress吗
  • 建设网站怎么赚钱discuz可以做公司网站
  • 彩票网站里的统计怎么做网站集约化建设的问题
  • 国内做的好的电商网站有哪些河源建设工程交易中心网站
  • 嘉鱼网站建设公司株洲网络学院
  • 医疗保健网站前置审批文件丽水市建设局网站
  • 太原做网站的鸣蝉公司网站开发费如何入账
  • 大连建设学校网站院长沈阳seo按天计费
  • 商城网站是怎么做的网站设置超链接
  • 淘宝网站开发的意义建网站选域名
  • 做企业网站的合同网站焦点图怎么做链接
  • 福建建设人才市场网站海口网