当前位置: 首页 > news >正文

网站名称是网址吗汉中专业网站建设推广

网站名称是网址吗,汉中专业网站建设推广,免费外链代发平台,软件外包是什么意思?一、 背景 某业务Clickhouse库月数据增长超过2.5T,云上Clickhouse容量并不是无限的,单节点有32T上限,而业务已使用一半以上,依此速度,半年内就将达到上限。 与业务讨论,大致有以下几种解决思路:…

一、 背景

        某业务Clickhouse库月数据增长超过2.5T,云上Clickhouse容量并不是无限的,单节点有32T上限,而业务已使用一半以上,依此速度,半年内就将达到上限。

        与业务讨论,大致有以下几种解决思路:

  • 按时间清理数据,但因为业务特点,能清理的数据不多
  • 改造为分片模式,但涉及业务改动量较大
  • 利用阿里云Clickhouse自带的冷热数据分层存储功能,从文档来看,操作简单、业务改动量也最小,于是业务进行调研与测试

二、 冷热数据分层存储

1. 背景知识

  • 热数据:访问频次较高的数据,存储在热数据盘(即创建集群时所选的ESSD云盘或高效云盘)中,满足高性能访问的需求

  • 冷数据:访问频次较低的数据,存储在较低价的冷数据盘(OSS)中,满足高性价比的需求

2. 两种存储策略

  • 默认存储策略(按空间):新写入的数据存储在热数据盘中,当热数据存储量达到业务指定阈值时,自动将当前热数据盘中占用空间最大的part数据文件移动到冷数据盘存储,从而释放热数据盘存储空间。
  • TTL存储策略(按时间):在默认存储策略基础上,添加TTL语句,实现将间隔时间之前的所有数据自动转移到冷数据盘中。

三、 注意事项

容易踩到和已经踩到的一些坑

1. 版本问题

默认阿里云界面现在已经建不了20.8版本以下的Clickhouse,对于新实例问题不大。

  • 云数据库ClickHouse集群为社区兼容版且版本为20.8及以上版本
  • 云数据库ClickHouse企业版基于缓存及共享存储,自动进行冷热分层,不依赖冷热数据存储规则

2. 关闭备份

       这个有点坑,使用冷热分层后就不支持备份恢复了。但好在ClickHouse一般是数仓和报表业务用,本身有源数据,即使误删还能从上游拉回来,业务评估风险可以接受。

3. 重启生效

开通该功能后集群会立即进行重启,需要提前预约变更窗口

4. 只开不关

冷热数据分层存储功能开通后,暂不支持关闭

5. meta节点inode使用率暴增

        这个是文档中完全没有提及的部分,可以看到,在不到两个小时,inode使用率从接近0快速涨到100%,且meta节点无法在界面扩容,后联系阿里云紧急在后台为meta节点扩容才恢复。

 

     阿里云的解释是迁移到oss中的数据,每个part会映射到Clickhouse的meta节点上,占用一个inode。当表part数过多,而又没有设置合并,就可能触发这个问题。

      对此的建议:

  • 表分批迁移,优先迁移表大而part相对较少的,收益较大
  • 设置prefer_not_to_merge参数为false,对冷数据中的part也进行合并(对性能有明显影响)
  • 提前估算迁移part数与inode使用率,必要时联系阿里云提前扩meta节点
  • 社区新版本对此功能有计划优化,但何时上线还不明确,且还需业务进行升级

四、 启用及设置

1. 功能启用

非常简单,点击开通即可

2. 默认存储策略设置

两个核心参数

参数

说明

move_factor

当热数据盘中的可用存储空间所占比例小于该参数时,自动将当前热数据盘中占用空间最大的part数据文件移动到冷数据盘存储。

取值范围为[0,1]。取值为0时,代表关闭基于磁盘存储容量的冷热数据分层存储。默认值为0.1,代表可用存储空间所占比例小于10%时,将自动进行数据移动。

一般来说生产表业务逻辑不太会允许根据空间大小挪数据,建议设为0

prefer_not_to_merge

冷数据盘中的数据是否进行合并。

  • true:不合并,默认值。对性能影响小,但part数可能非常多,出现前面的inode问题

  • false:合并。part可以合并,占用inode较少,但合并时性能影响较大,遇到过打满CPU的情况。

3. TTL设置

  • 创建时设置
-- 以date列为依据,将90天之前的所有数据移动到冷数据盘。
CREATE TABLE ttl_test_tbl
(`f1` String,`f2` String,`f3` Int64,`f4` Float64,`date` Date
)
ENGINE = MergeTree()
PARTITION BY date
ORDER BY f1
TTL date + INTERVAL 90 DAY TO DISK 'cold_disk'
SETTINGS storage_policy = 'hot_to_cold';

  • 创建后修改
ALTER TABLE <table_name> ON CLUSTER default MODIFY TTL <time_column> + INTERVAL <number> TO DISK 'cold_disk';
  • 存量数据:默认情况下,存量数据将按照新策略进行存储,但需要时间异步处理,如需立即生效,您需更改TTL分层存储策略之后,还要执行ALTER TABLE materialize TTL;语句。如果您不期望更改存量数据的TTL分层存储策略,需要在更改TTL分层存储策略之前,执行SET materialize_ttl_after_modify=0;语句。
  • 增量数据:默认情况下,增量数据也将按照新策略进行存储。

  • 更改TTL分层存储策略后,已经进入冷数据盘中的数据不会自动移动到热数据盘。

4. 移动冷热数据盘的数据

  • 热 -> 冷

ALTER TABLE <table_name> ON CLUSTER default MOVE PARTITION <partition> TO DISK 'cold_disk';
  • 冷 -> 热

ALTER TABLE <table_name> ON CLUSTER default MOVE PARTITION <partition> TO DISK 'default';

5. 查看数据

  • 查看热数据盘上的数据
SELECT * FROM system.parts WHERE database = '<db_name>' AND TABLE = '<tbl_name>' AND disk_name ='default' AND active = 1;
  • 查看冷数据盘上的数据
SELECT * FROM system.parts WHERE database = '<db_name>' AND TABLE = '<tbl_name>' AND disk_name ='cold_disk' AND active = 1;
  • 查看磁盘空间

SELECT * FROM system.disks;
  • 移动上下限值
SELECT move_ttl_info.min,move_ttl_info.max FROM system.parts WHERE database = '<db_name>'AND table = '<tb_name>'AND disk_name = 'default'

五、 大致效果

移动后可以看到冷数据空间逐渐增大

热数据存储使用率从93%左右降低至81%,大幅缓解空间压力

参考:

ClickHouse冷热数据分离存储_云数据库 ClickHouse(ClickHouse)-阿里云帮助中心

http://www.dtcms.com/a/481400.html

相关文章:

  • 网站底部导航栏网站建设最低多少钱
  • 网站开发能进入无形资产吗英文网站开发哪家好
  • 网站首页flash制作seo优化seo外包
  • 北京微信网站网页设计与网站建设在线考试石油大学
  • 如何做网站的注册页面宠物网站首页模板
  • 广州工程建设网站wordpress is admin
  • 软工毕设做网站自己的网站怎么和百度做友链
  • 阿里云服务器如何用IP做网站建设工程信息网官网首页
  • 大学生网站设计大作业做家教需要什么哪个网站的会员
  • 白银网站建设白银做网站是用wordpress还是DW
  • 如何做网站的后台管理周口网站建设73data
  • 百度旗下的外贸建站公司教育培训机构加盟
  • 做网站之前的工作福州 网站设计公司
  • 北京网站设计联系电话租房网站开发文献综述模板
  • 做网站的计划概要建筑安全网
  • 昆山哪里有做网站的社交网站备案
  • 内部网站建设公司手机端网站排名
  • 博客系统做网站泉州seo排名
  • 菏泽建设局网站千牛网页版登录入口
  • 做网站难度国外网站大牛不懂英语可以做吗
  • wordpress 迁移升级谷歌排名优化入门教程
  • 网站商品展示页怎么做的软文代写服务
  • 免费 支付宝购物网站模版代码高亮网站
  • kesioncms企业网站蓝色模板网址大全2345视频
  • 做外贸接私单的网站263企业邮箱网页登录入口
  • 马鞍山市 网站建设网站的设计制作流程
  • 嘉兴网站建设低价推荐深圳福田教育
  • 旅行社网站建设设计公司哪家好房产网签是什么意思
  • 温州建设局网站深圳建设企业网站公司
  • 嘉定区整站seo十大排名家装设计公司排行榜