当前位置: 首页 > wzjs >正文

深泽网站制作百度用户服务中心

深泽网站制作,百度用户服务中心,wordpress图片暗箱,个人做网站如何推广一、Refresh/Flush/Merge机制与性能影响 Refresh(刷新) 作用:将内存缓冲区(In-memory buffer)数据写入文件系统缓存生成新段(Segment),使文档可被搜索性能影响: 默认每…
一、Refresh/Flush/Merge机制与性能影响
  1. Refresh(刷新)
  • 作用:将内存缓冲区(In-memory buffer)数据写入文件系统缓存生成新段(Segment),使文档可被搜索
  • 性能影响:
    • 默认每秒自动执行,保证近实时搜索(NRT)
    • 频繁手动刷新会降低索引吞吐量
    • 配置建议:index.refresh_interval = 30s(写入密集型场景)
  1. Flush(刷盘)
  • 作用:
    1. 将文件系统缓存数据持久化到磁盘
    2. 清空事务日志(Translog)
    
  • 性能影响:
    • 触发条件:Translog大小阈值(默认512MB)或时间阈值(30分钟)
    • 涉及磁盘IO,高频率刷盘会显著影响集群性能
  1. Merge(段合并)
  • 作用:合并多个小段为更大段,提升查询性能
  • 性能影响:
    // 合并策略配置示例
    PUT /index/_settings {"index.merge.policy": {"max_merged_segment": "5gb",    // 最大合并段大小"segments_per_tier": 10         // 每层段数量}
    }
    
    • 后台线程自动执行,消耗大量IO/CPU资源
    • 强制合并(_forcemerge)建议在业务低峰期执行

开发建议 :

  1. 优先使用默认配置,确有性能瓶颈时再调整
  2. 高负载场景可增大Refresh间隔减少IO压力
  3. 避免频繁执行_flush和_forcemerge等手动操作
  4. 监控 indices.refresh.time 和 merges 相关指标辅助调优
二、近实时(NRT)搜索原理
一、全称与核心原理
  1. 全称
    Near Real-Time(近实时)

  2. 实现原理

数据写入流程:
1. 文档写入内存缓冲区(1ms内完成)
2. 通过refresh操作将数据刷到文件系统缓存(默认1秒)
3. 新生成的段(Segment)对搜索可见
4. Translog保障数据持久化(崩溃恢复)
二、开发者实践指南
  1. 配置优化
// 调整refresh间隔(trade-off实时性与吞吐量)
PUT /your_index/_settings {"index.refresh_interval": "30s"  // 默认1s,写入密集型场景建议调大
}
  1. 强制刷新API
# 立即刷新使新文档可搜索(生产环境慎用)
POST /your_index/_refresh?pretty
  1. 近实时写入模式
// Java客户端写入时指定刷新策略
IndexRequest request = new IndexRequest("your_index");
request.source(jsonMap, XContentType.JSON);
request.setRefreshPolicy(WriteRequest.RefreshPolicy.WAIT_UNTIL);  // 可选值:IMMEDIATE, WAIT_UNTIL, NONE
  1. 可靠性保障
通过Translog机制实现:
- 每个分片维护自己的事务日志
- 默认配置下每隔5s刷盘(index.translog.sync_interval)
- 超过512MB自动刷盘(index.translog.flush_threshold_size)
三、性能优化建议
  1. 写入场景
高吞吐场景:- refresh_interval调至30s-1min- 关闭副本(index.number_of_replicas: 0)初始化时- 使用bulk API批量写入
  1. 查询场景
实时性要求高时:
PUT /your_index/_settings {"index.search.idle.after": "0s"  // 禁用查询缓存自动过期
}
  1. 监控指标
# 查看refresh统计
GET /_stats/refresh?pretty# 查看segment状态
GET /_cat/segments?v&h=index,segment,size,committed,search
三、Terms vs Cardinality聚合
特性Terms聚合Cardinality聚合
用途统计每个唯一值的出现次数估算字段唯一值数量(基数)
精度精确统计基于HyperLogLog++算法(误差率0.5%)
内存消耗高(存储所有唯一值)低(固定大小寄存器)
适用场景分类统计(如热门商品TOP10)UV统计(如独立访客数)

示例场景:

// Terms聚合 - 统计热门商品
{"aggs": {"popular_items": {"terms": { "field": "product_id","size": 10}}}
}// Cardinality聚合 - 统计独立用户数 
{"aggs": {"unique_users": {"cardinality": {"field": "user_id","precision_threshold": 1000}}}
}
http://www.dtcms.com/wzjs/39135.html

相关文章:

  • 合肥网站制作哪家好怎么做好seo推广
  • 一级a做爰片软件网站厦门seo管理
  • 编程app下载山西搜索引擎优化
  • 怎么把网站做的靠前成都网站快速排名提升
  • 武汉网站制作seo基础理论
  • 嘉兴网站制作建设市场推广专员
  • 江门网站制作费用百度统计手机app
  • ps怎么做网站的首页青岛seo青岛黑八网络最强
  • 石家庄外贸网站建设一个新的app如何推广
  • php网站开发工程师招聘要求经典营销案例
  • 网站内容建设包括推广接单平台哪个好
  • web期末网站设计大作业推广方案框架
  • 国内做网上旅游业务的网站链接生成器
  • 网站建设网络推广微信网站做网站需要什么条件
  • 虚拟主机网站空间怎么样建立自己的网站
  • app对接网站查询网址域名ip地址
  • 网站建设需要哪个部门审批推广发帖网站
  • 科站网站关键词排名点击软件怎样
  • 网站建设公司 广告法被处罚今日头条搜索优化
  • 谁做网站做的比较可信子域名网址查询
  • 纯flash网站欣赏seo俱乐部
  • 网站的360快照怎么做it培训机构
  • dreamweaver网站建设教程深圳关键词优化软件
  • 电子商务网站建设与管理课程评价软文广告300字范文
  • 日本设计 网站广州专门做seo的公司
  • 浙江建设厅网站公司网站制作公司
  • 阿里巴巴网站头像你会放什么做头像品牌策划案例
  • 武汉网站制作027中国企业100强
  • 做代理的项目在哪个网站域名查询网
  • 做评选活动的网站淘宝网店的seo主要是什么