当前位置: 首页 > wzjs >正文

网站制作加双链接怎么做辽宁省建设银行e护航网站

网站制作加双链接怎么做,辽宁省建设银行e护航网站,wordpress php speedy,百度旗下所有app列表文章目录 背景问题1,Filesystem Cache 里放的是啥问题2,哪些查询它们会受益于文件系统缓存 问题3 查询分析 背景 对于es 优化来说常常看到会有一条结论给,给 JVM Heap 最多不超过物理内存的 50%,且不要超过 31GB(避免…

文章目录

      • 背景
        • 问题1,Filesystem Cache 里放的是啥
        • 问题2,哪些查询它们会受益于文件系统缓存
      • 问题3 查询分析

背景

对于es 优化来说常常看到会有一条结论给,给 JVM Heap 最多不超过物理内存的 50%,且不要超过 31GB(避免压缩指针失效)。剩下的内存尽量留给操作系统做文件系统缓存。es查询重度依赖
Filesystem Cache。

问题1,Filesystem Cache 里放的是啥

文件系统缓存保存的是什么?
文件系统缓存由操作系统管理,而不是 Elasticsearch。
它缓存的是从磁盘读取的文件内容,比如 Lucene 构建的倒排索引文件(segment files)。
这些文件包括:
.fnm (field names)
.tim / .tip (term index and dictionary)
.doc / .pos / .pay (document values, positions, payloads)
.dvd / .dvm (doc values)
等等。
这些数据构成了 Elasticsearch 实现快速全文检索的核心结构 —— 倒排索引(Inverted Index)

问题2,哪些查询它们会受益于文件系统缓存

以下是一些典型的查询类型和场景,它们会受益于文件系统缓存:
🔹1. Term 查询 / Term-level 查询
示例:精确匹配某个字段值

{"query": {"term": {"status": "published"}}
}

解释:
term 查询会查找包含特定 term 的文档。
Lucene 使用 .tim(Term Index) 和 .tip(Term Dictionary) 文件快速定位 term。
如果这些文件已经在文件系统缓存中,则完全不需要磁盘 I/O。
🔹2. Terms 查询
示例:匹配多个枚举值

{"query": {"terms": {"category": ["books", "electronics", "movies"]}}
}

解释:
多个 term 的组合查询。
每个 term 都会在倒排索引中查找对应的文档列表。
只要 .tim, .tip, .doc, .pos 等文件都在缓存中,性能非常高。
🔹3. Range 查询(数值或时间范围)
示例:查询某段时间内的订单

{"query": {"range": {"timestamp": {"gte": "2024-01-01","lt": "2025-01-01"}}}
}

解释:
如果字段是 keyword 或已经构建了 doc values(.dvm, .dvd),Lucene 会利用排序结构进行快速范围扫描。
如果相关 segment 的 .dvd 文件在缓存中,范围查询非常高效。
🔹4. Filter 上下文中的查询(Query in Filter Context)
示例:
{

  "query": {"bool": {"filter": [{ "term": { "status": "published" } },{ "range": { "price": { "gte": 100, "lt": 500 } } }]}}
}

解释:
filter 上下文不计算相关度分数,只关心是否匹配。
Lucene 会使用 bitset 来加速 filter 查询,如果索引文件已在缓存中,速度极快。
filter 查询非常适合利用缓存,因为结果可重复使用(适合 cache)。
🔹5. 聚合查询(Aggregations)
示例:按 category 分组统计数量

{"size": 0,"aggs": {"categories": {"terms": { "field": "category.keyword" }}}
}

解释:
聚合操作需要遍历大量文档,读取字段值。
如果字段是 keyword 类型,Lucene 使用全局序号(global ordinals)和 .gob 文件进行处理。
如果这些文件在缓存中,聚合速度非常快,否则会触发大量磁盘读取。
🔹6. Doc value 字段查询
示例:

{"query": {"range": {"price": {"gte": 100,"lt": 500}}}
}

解释:
如果 price 字段开启了 doc_values(默认开启),Lucene 使用 .dvd 和 .dvm 文件来存储列式数据。
这些文件会被操作系统缓存在内存中,所以范围查询、排序、聚合等都非常快。
🔹7. 前缀查询(Prefix Query)
示例:

{"query": {"prefix": {"name": "elasti"}}
}

问题3 查询分析

  • 如果_source 是true的话,要先查系统缓存,找到文档ID ,再查磁盘找到原始文件
  • 如果返回的是部分字段?
    下面我们详细解释每种方式的工作原理。

🔍 一、使用 _source filtering(源过滤)
这是最常见的方法,适用于你只想返回原始文档中的某些字段。

示例:
json

{"_source": {"includes": ["title", "author"]},"query": {"term": {"status": "published"}}
}

工作流程:
Elasticsearch 仍然会从 .source 文件中加载整个原始文档。
然后在内存中进行字段过滤,只保留你需要的字段。
最终只返回这些字段给客户端。
💡 关键点:
即使你只要几个字段,Elasticsearch 仍需要加载完整 _source。
如果 .source 文件不在文件系统缓存中,就会触发磁盘 I/O。
所以:虽然减少了网络传输量,但没有减少磁盘访问。
🔍 二、使用 store: true 的 stored fields(存储字段)
如果你只需要少量字段,并希望快速获取它们而不需要加载整个 _source,可以在 mapping 中为某些字段设置 store: true。

示例 mapping:
json

{"mappings": {"properties": {"title": { "type": "text", "store": true },"author": { "type": "keyword", "store": true },"content": { "type": "text" }  // 默认不存储}}
}

查询时:
json

{"stored_fields": ["title", "author"],"source": false,"query": {"term": {"status": "published"}}
}

工作流程:
Elasticsearch 从 Lucene 的 .fdt / .fdx 文件中读取存储字段(stored fields)。
这些文件是独立于 _source 的。
如果这些文件在文件系统缓存中,查询速度非常快。
💡 关键点:
没有加载 _source,所以节省了内存和磁盘 I/O。
更适合“高频访问 + 字段少”的场景。
缺点是:占用更多磁盘空间 ,因为每个字段都单独存储了一份。
🔍 三、使用 docvalue_fields(适合聚合/排序)
对于 keyword 类型或数值类型字段,Lucene 使用 doc values 来支持高效的排序和聚合。

示例:

{"docvalue_fields": ["price", "publish_date"],"source": false,"query": {"term": {"status": "published"}}
}

工作流程:
Elasticsearch 从 .dvd, .dvm 文件中读取字段值。
这些文件也是列式存储,非常适合批量读取。
如果这些文件在缓存中,性能非常高。
💡 关键点:
完全不依赖 _source。
对聚合、排序、范围查询非常有用。
不适合返回大量文本内容(如文章正文)。


文章转载自:

http://mhW4cUeu.xscpq.cn
http://OFFIzD8x.xscpq.cn
http://4Y9dC5dr.xscpq.cn
http://3mcLuotj.xscpq.cn
http://T6u8opNS.xscpq.cn
http://VgtdhIoP.xscpq.cn
http://8s8rmNyN.xscpq.cn
http://ZljyHKeL.xscpq.cn
http://COPksb0I.xscpq.cn
http://JEDP9gYx.xscpq.cn
http://seUpQqI8.xscpq.cn
http://KMEpqLFf.xscpq.cn
http://BXpE8p1c.xscpq.cn
http://Ka5qfy9g.xscpq.cn
http://K8jsbiBf.xscpq.cn
http://uQvkyjmN.xscpq.cn
http://HdXcM8ol.xscpq.cn
http://tvEEaWMl.xscpq.cn
http://dAdOJm1v.xscpq.cn
http://UwZD6ESv.xscpq.cn
http://uCaD4ktH.xscpq.cn
http://NT7GbmWY.xscpq.cn
http://annLRFGu.xscpq.cn
http://XdmVYmFI.xscpq.cn
http://MN0gLMVH.xscpq.cn
http://Gf9CXv0y.xscpq.cn
http://rPbXLEQL.xscpq.cn
http://OmFHWifa.xscpq.cn
http://GVbORZgC.xscpq.cn
http://0jBIzAUI.xscpq.cn
http://www.dtcms.com/wzjs/637907.html

相关文章:

  • 免费网站可以做淘宝客吗域名怎么绑定网站
  • 龙岗网站建设多少钱网页链接制作生成二维码
  • 四川外国语大学网站建设系网站中队人物介绍怎么做
  • wd怎样建设一个网站wordpress地方信息主题
  • 网站运营的成本动易的网站能否静态
  • 苏州企业网站制作服务wp rocket wordpress
  • 进贤城乡规划建设局网站旅游网站开发 目的及必要性
  • 山东省济宁市嘉祥县建设局网站兰州画册设计
  • 工信部网站备案查通知高中生做那个的网站
  • 电商网站联盟平台wordpress rss订阅地址
  • 英文网站常用字体品牌排行榜哪个网站更权威
  • 做网站要学习什么wordpress 拍卖
  • 卓越 网站建设 深圳西乡和网站建设签合同
  • 网站设计分析公司网站建设的目的
  • 怎么推广我的网站吗郑州 做网站
  • vps上创建网站如何选择最好的域名
  • 最大的搜索网站排名中国最新军事动态中国最新军事新闻
  • 学校联系我们网站制作优秀金融网站设计
  • 做网站seo推广公司wordpress 去优酷广告插件
  • 做网站的要多钱辽宁建设工程信息网那个
  • 在线图表生成器网站如何优化一个关键词
  • 如何清空网站数据库网页微信网址
  • 网站制作营销型六安网站关键词排名优化地址
  • 专门做房产的网站河南专业网站建设
  • 网站seo培训镇江网站建设找思创
  • 石家庄网站建设公司logo设计大师
  • 济南集团网站建设方案山东省住房和城乡建设厅电话号码
  • 在企业网站建设的解决方案中淘宝网站建设类目
  • 网站红色北京比较好的it公司
  • 中国公路建设协会网站室内装修设计师资格证怎么考