当前位置: 首页 > news >正文

河南建设监理协会网站电话朋友圈推广怎么收费

河南建设监理协会网站电话,朋友圈推广怎么收费,平面广告设计介绍,百度搜索首页数据冷热分离、分库分表与Elasticsearch的应用详解 一、数据冷热分离 定义:将数据根据访问频率、重要性或时间划分为热数据(高频访问)和冷数据(低频访问),并存储在不同介质或系统中,以优化成本…

数据冷热分离、分库分表与Elasticsearch的应用详解

一、数据冷热分离

定义:将数据根据访问频率、重要性或时间划分为热数据(高频访问)和冷数据(低频访问),并存储在不同介质或系统中,以优化成本和性能。


实现方法
  1. 划分标准

    • 时间维度:例如,近3个月的数据为热数据,历史数据为冷数据。
    • 访问频率:通过监控日志统计数据的访问次数,高频数据标记为热数据。
    • 业务规则:如VIP用户数据为热数据,普通用户数据为冷数据。
  2. 存储策略

    • 热数据:使用高性能存储(如SSD、内存数据库Redis)。
    • 冷数据:迁移到低成本存储(如HDD、对象存储S3、归档数据库)。
  3. 自动化迁移

    • 工具:Apache Hudi、AWS Glue、自定义脚本。
    • 触发机制:定时任务(每日凌晨迁移)、事件驱动(数据达到冷热阈值时触发)。
  4. 查询透明性

    • 统一接口:通过中间件(如ProxySQL)或视图(View)合并冷热数据查询。
    • 示例:MySQL联合表(FEDERATED引擎)或分布式查询引擎(Presto)。

优缺点
优点缺点
降低存储成本(冷数据用廉价存储)冷数据访问延迟较高
提升热数据访问性能数据迁移可能影响业务一致性
延长主数据库生命周期需维护冷热数据同步逻辑

二、分库分表

定义:将单一数据库/表拆分为多个数据库/表,以解决数据量过大或并发过高的问题。


分库分表策略
  1. 垂直分库

    • 按业务拆分:例如,用户库、订单库、商品库。
    • 优点:业务解耦,降低单库压力。
    • 缺点:跨库事务复杂(需分布式事务如Seata)。
  2. 水平分库分表

    • 哈希分片:按主键哈希值分配到不同库/表。
    • 范围分片:按时间或ID范围划分(如2023年数据存DB1)。
    • 一致性哈希:减少扩容时的数据迁移量。
  3. 分片键选择

    • 高频查询字段:如用户ID、订单ID。
    • 避免热点:确保分片均匀(如订单ID使用雪花算法生成)。

实现工具
  • 中间件方案:ShardingSphere、MyCat(透明分片,SQL路由)。
  • 客户端方案:业务代码直接控制分片逻辑(如按用户ID取模)。

挑战与解决方案
挑战解决方案
跨库关联查询冗余字段、全局表、改用NoSQL宽表模型
分布式事务2PC、TCC、最终一致性(如消息队列补偿)
分片扩容预分片(如1024逻辑表)、双写迁移

三、为什么要用Elasticsearch(ES)?

核心优势:ES是专为搜索与分析设计的分布式引擎,解决传统数据库在复杂查询和全文搜索上的瓶颈。


适用场景
  1. 全文搜索

    • 支持分词、模糊查询(如商品名称搜索)。
    • 示例:电商平台搜索“红色 连衣裙”匹配相关商品。
  2. 日志分析

    • 高效处理TB级日志(如ELK Stack:ES + Logstash + Kibana)。
    • 实时聚合分析(如统计每分钟错误日志数量)。
  3. 复杂聚合

    • 多维度统计(如按地区、时间统计销售额)。
    • 支持Pipeline聚合(嵌套聚合计算)。
  4. 实时性要求高

    • 数据写入后近实时(1秒内)可查。

与传统数据库对比
维度Elasticsearch关系型数据库(MySQL)
数据模型文档型(JSON)、Schema-less行列结构、严格Schema
查询能力全文搜索、聚合分析、地理位置查询精确查询、简单聚合
事务支持不支持ACID,最终一致性支持ACID事务
扩展性天然分布式,水平扩展容易垂直扩展或分库分表

典型架构集成
  1. 数据同步

    • ETL工具:Logstash、Debezium(CDC捕获数据库变更)。
    • 双写:应用同时写入MySQL和ES(需处理一致性)。
  2. 查询路由

    • 搜索请求直接访问ES,事务操作走MySQL。

使用ES的代价
  • 数据冗余:需将关系型数据同步到ES。
  • 维护成本:集群管理、索引优化(分片、副本设置)。
  • 一致性延迟:数据从MySQL同步到ES存在短暂延迟。

总结

  • 数据冷热分离:按访问模式优化存储,降低成本。
  • 分库分表:解决单库性能瓶颈,需权衡分片策略与复杂度。
  • Elasticsearch:弥补关系数据库在搜索和分析上的不足,适合全文检索、日志处理等场景。

选型建议

  • 冷热分离用于有明显访问差异的数据。
  • 分库分表适用于数据量大且增长快的OLTP系统。
  • ES用于需要高效搜索和复杂聚合的OLAP场景。

在这里插入图片描述

http://www.dtcms.com/a/566595.html

相关文章:

  • 东莞专业拍摄做网站照片重庆旅游攻略详细安排
  • 从 OpenSearch 到 Apache Doris:领创集团日志系统升级实践,降本 45%
  • InvSR:Arbitrary-steps Image Super-resolution via Diffusion Inversion
  • 广东省省考备考(第一百四十天11.3)——数量关系、资料分析(强化训练)
  • 网站性能优化三明网站开发
  • 【动态规划:01背包】01背包详解 模板题 优化
  • 专门做餐饮空间设计的网站ui设计常用软件
  • 企业信息公示平台徐州seo
  • 雕塑网站模板电商网站设计的流程
  • RAE:Diffusion Transformers with Representation Autoencoders
  • 医院网站开发多少钱烟台网络公司员工人数
  • 算法学习记录11——Python 多变量赋值问题
  • 怎样拥有自己的网站外行学习个人网站建设
  • 建设部城市管理监督局网站官网建站系统源代码
  • html网站地图模板房地产型网站建设
  • 基于YOLOv10的水质污染检测:水面漂浮油污与垃圾智能识别实战
  • 大唐网站建设全国文明城市创建方案
  • 奉贤集团网站建设军队房地产与建设工程法律实务在哪个网站可以购买
  • 上海做网站培训班成都室内设计公司排名前十
  • 建设网站公司是什么淘宝网站的推广方案
  • 长沙自助模板建站网上商城是什么
  • 【动手学深度学习】关于数据转换的时候出现TypeError和iloc
  • 网站建设案例 杭州远大昆明网站建设 熊掌号
  • 无锡网站建设方案优化网站建设吕凡科技
  • MODBUS协议学习(基于RS485总线)一文学会
  • Win10/Win11文件夹图片不能预览怎么解决?
  • linux之arm SMMUv3 client 设备DMA配置过程分析(8)
  • Java企业实战微服务全栈零基础完整使用
  • 做外贸 网站邮箱申请百度自动点击器
  • 楼盘 东莞网站建设关于网站建设的合同范本