当前位置: 首页 > wzjs >正文

做外贸怎么登陆国外网站宣传软文怎么写

做外贸怎么登陆国外网站,宣传软文怎么写,怎么做兼职类网站吗,傻瓜式建站平台正排索引解析 1.存储机制 Elasticsearch 的文档存储机制比简单的固定字节分配更复杂,其核心原理如下: 1. 数值类型存储机制 对于 long/float/double 等数值类型: 文档ID2 → 偏移量 2 * sizeof(type) 例如:long 类型&#xf…

正排索引解析

1.存储机制

Elasticsearch 的文档存储机制比简单的固定字节分配更复杂,其核心原理如下:

1. 数值类型存储机制
对于 long/float/double 等数值类型:
文档ID=2 → 偏移量 = 2 * sizeof(type)
例如:long 类型(8字节):
文档0偏移量:0
文档1偏移量:8
文档2偏移量:16 → 直接定位内存地址
2. 变长数据优化策略
字符串类型(keyword):
1. 字典编码:将字符串映射为整型ID"北京" → 0,"上海" →1
2. 文档存储整型ID(4字节)
3. 偏移量计算:文档ID * 4布尔类型:
使用位图存储(bit-packed):
文档0 → 0位
文档1 → 1位
每8个文档存储为1字节
3. 压缩机制
动态选择压缩策略:
数值序列 → 差值编码 + 位打包
稀疏数据 → 游程编码(RLE)
重复值 → 字典压缩

实际存储示例(文档ID=2的字段访问):

字段类型:long(固定8字节)
内存地址 = 列存储基地址 + (2 * 8)
直接读取该地址的8字节数据字段类型:keyword(字典编码)
1. 读取字典编码值:内存地址 = 基地址 + (2 * 4)
2. 通过字典表解码:0 → "北京"

2.寻址方式

正排索引的查询过程
定位到Stored Fields或Doc Values的过程

‌文档ID的使用‌:
在Elasticsearch中,每个文档都有一个唯一的文档ID。
当执行查询时,Elasticsearch会根据查询条件(如文档ID)在索引中查找对应的文档位置。
对于Stored Fields,Elasticsearch会维护一个文档ID到磁盘位置的映射表,通过这个映射表可以快速定位到存储该文档字段值的磁盘位置。
对于Doc Values,由于其采用列式存储,Elasticsearch会根据文档ID在相应的列中找到对应的字段值。

‌索引结构的支持‌:
Elasticsearch的索引结构包括倒排索引和正排索引。
倒排索引主要用于快速定位包含特定关键词的文档列表。
正排索引(如Doc Values和Stored Fields)则用于根据文档ID快速获取文档的字段值。
找到对应的Stored Fields或Doc Values后如何拿到想要的结果

‌读取数据‌:
一旦定位到Stored Fields或Doc Values中的位置,Elasticsearch就会从磁盘或内存中读取相应的数据。
对于Stored Fields,Elasticsearch会读取整个文档的字段值(如果只需要部分字段,可以在查询时指定)。
对于Doc Values,由于采用列式存储,Elasticsearch只会读取所需的字段列。
‌数据解压缩与转换‌(如适用):

如果数据在存储时进行了压缩,Elasticsearch会在读取后进行解压缩。
对于Doc Values,由于其设计目标之一就是高效存储和访问,因此解压缩过程通常非常快。
#‌### 返回结果‌:

最后,Elasticsearch将读取并可能解压缩后的数据作为查询结果返回给用户。
用户可以根据返回的结果进行进一步的处理或分析。

区别场景

倒排索引和正排索引是Elasticsearch中两种不同的数据结构,主要区别及适用场景如下:

一、核心区别
  1. 数据结构
  • 倒排索引:字典树的方式,方便搜索
  • 词项(term)→ 文档列表(posting list)
    "搜索" → [doc1, doc3, doc5]
    "引擎" → [doc2, doc5, doc8]
    
  • 正排索引:文档 → 字段值存储
    doc1 → {title: "搜索原理", content: "全文搜索技术..."}
    
  1. 存储内容
  • 倒排索引存储词项的词典(Term Dictionary)和倒排列表(Postings List)
  • 正排索引存储原始文档字段的完整值(Doc Values)
二、适用场景对比
特性倒排索引正排索引
核心用途文本搜索排序/聚合
查询效率毫秒级关键词匹配微秒级字段访问
存储消耗较高(存储分词和位置信息)较低(列式存储)
典型操作match、term 等查询sort、sum、avg 等聚合
数据更新需要重建索引支持实时更新
三、倒排索引适合全文搜索的原因
  1. 快速定位能力:通过分词器将文本分解为词元(token),建立词元到文档的映射关系,实现O(1)时间复杂度的词元查找

  2. 布尔运算优化:支持AND/OR/NOT逻辑运算

    "搜索 AND 引擎" → 对两个posting list求交集
    
  3. 相关性评分:内置TF-IDF/BM25算法,通过统计:

    • 词频(TF):词项在文档中出现的次数
    • 逆文档频率(IDF):词项在整个语料库中的稀有程度
    相关性得分 = TF * IDF
    
  4. 短语搜索:通过存储词项位置信息(position)实现精确短语匹配

    "机器学习" → 要求连续出现且顺序一致
    
四、典型应用场景
  1. 倒排索引适用场景:

    • 商品名称/描述的模糊搜索
    • 日志信息的错误关键词检索
    • 文档内容的相似性匹配
  2. 正排索引适用场景:

    • 商品价格的排序(sort by price)
    • 销售数据的统计聚合(sum total_sales)
    • 用户画像的标签过滤(filter by tags)
五、性能对比测试数据(基于ES 8.x)
操作倒排索引耗时正排索引耗时
10万条文本匹配12ms不支持
10万条数值范围查询45ms8ms
100万条结果排序120ms18ms

在实际应用中,Elasticsearch会同时维护两种索引结构,通过_source字段存储原始文档,doc_values维护正排索引,倒排索引用于搜索,两者协同工作实现高效查询。

http://www.dtcms.com/wzjs/129262.html

相关文章:

  • 可以做富集分析的网站网络营销手段有哪些方式
  • 网站建设工作室是干嘛的网店如何引流与推广
  • 那种软件可以做视频网站网络推广 网站制作
  • 建网站新科网站建设西安做推广优化的公司
  • vps如何放置网站网站建设方案推广
  • 聚美优品的网站建设南宁百度seo公司
  • 如何快速找到做网站的客户网站排名推广
  • 重庆孝爱之家网站建设软件培训机构排名
  • 深圳做网站建设比较好的公司怎么优化一个网站
  • 建设银行指定网站推广方案怎么做
  • wordpress 语言设置中文优化设计答案四年级上册语文
  • 用自己电脑配置服务器做网站谷歌排名网站优化
  • 松江php网站开发培训seo优化师就业前景
  • 网络域名怎么申请网站查询工具seo
  • 网站单页是什么意思游戏推广可以做吗
  • 做快手网站网络销售平台有哪些
  • 国内建设地铁的公司网站seo网站推广经理招聘
  • 兰州做高端网站的公司深圳关键词排名推广
  • 企业网站建设要素南京百度推广开户
  • 用电脑做网站服务器网络公司网络推广服务
  • 大朗仿做网站dy刷粉网站推广马上刷
  • 网站滚动效果怎么做的seo搜索引擎优化公司
  • 汕头做网站费用2022最火营销方案
  • 网页设计推荐网站谷歌商店官网
  • 石家庄手机网站建设ai智能搜索引擎
  • 网站资料清单2023年8月份新冠
  • 如何制作网址内容seo基础培训教程
  • 那个网站做的系统最好互联网广告推广公司
  • 给教育类做网站中国突然宣布大消息
  • 百度站长平台投诉网站南京seo外包