当前位置：首页 > wzjs >正文

wordpress站安装百度商桥免费建网站的平台

wzjs 2025/9/10 6:28:40

wordpress站安装百度商桥,免费建网站的平台,网站怎么生成二维码,爱站长背景本文来从底层代码的实现来分析一下Starrocks怎么获取统计信息，这些统计信息在后续基于CBO的代价计算的时候有着重要的作用本文基于Starrrocks 3.3.5 结论 Starrocks的统计信息的收集是通过周期性的运行一系列的SQL（以分区为维度，如果…

背景

本文来从底层代码的实现来分析一下Starrocks怎么获取统计信息，这些统计信息在后续基于CBO的代价计算的时候有着重要的作用
本文基于Starrrocks 3.3.5

结论

Starrocks的统计信息的收集是通过周期性的运行一系列的SQL（以分区为维度，如果不是分区表，其实也有个默认的分区,也就是单个分区），之后插入到_statistics_.column_statistics表中,并会存储在 GlobalStateMgr.CachedStatisticStorage，后续所有的统计信息的获取也是通过这里获取的

分析

直接到StatisticAutoCollector类

    public StatisticAutoCollector() {super("AutoStatistic", Config.statistic_collect_interval_sec * 1000);}

这里默认的调度周期是 statistic_collect_interval_sec (也就是5分钟)

    @Overrideprotected void runAfterCatalogReady() {// update intervalif (getInterval() != Config.statistic_collect_interval_sec * 1000) {setInterval(Config.statistic_collect_interval_sec * 1000);}if (!Config.enable_statistic_collect || FeConstants.runningUnitTest) {return;}if (!checkoutAnalyzeTime(LocalTime.now(TimeUtils.getTimeZone().toZoneId()))) {return;}// check statistic table stateif (!StatisticUtils.checkStatisticTableStateNormal()) {return;}initDefaultJob();runJobs();}

强制调度周期设置为5分钟
进行调度时间的检查，默认是一天，也可以设置开始和结束时间,statistic_auto_analyze_start_time,statistic_auto_analyze_end_time
还可以设置enable_statistic_collect为false，如果不想进行统计信息的采集的话
initDefaultJob 初始化统计信息采集任务,默认是 enable_collect_full_statistic 为 true,也就是全量采集

runJobs 运行采集任务，也就是最核心的阶段

     protected List<StatisticsCollectJob> runJobs() {...Set<Long> analyzeTableSet = Sets.newHashSet();for (NativeAnalyzeJob nativeAnalyzeJob : allNativeAnalyzeJobs) {List<StatisticsCollectJob> jobs = nativeAnalyzeJob.instantiateJobs();result.addAll(jobs);ConnectContext statsConnectCtx = StatisticUtils.buildConnectContext();statsConnectCtx.setThreadLocalInfo();nativeAnalyzeJob.run(statsConnectCtx, STATISTIC_EXECUTOR, jobs);for (StatisticsCollectJob job : jobs) {if (job.isAnalyzeTable()) {analyzeTableSet.add(job.getTable().getId());}}}LOG.info("auto collect statistic on analyze job[{}] end", analyzeJobIds);if (Config.enable_collect_full_statistic) {LOG.info("auto collect full statistic on all databases start");List<StatisticsCollectJob> allJobs =StatisticsCollectJobFactory.buildStatisticsCollectJob(createDefaultJobAnalyzeAll());for (StatisticsCollectJob statsJob : allJobs) {// user-created analyze job has a higher priorityif (statsJob.isAnalyzeTable() && analyzeTableSet.contains(statsJob.getTable().getId())) {continue;}result.add(statsJob);AnalyzeStatus analyzeStatus = new NativeAnalyzeStatus(GlobalStateMgr.getCurrentState().getNextId(),statsJob.getDb().getId(), statsJob.getTable().getId(), statsJob.getColumnNames(),statsJob.getType(), statsJob.getScheduleType(), statsJob.getProperties(), LocalDateTime.now());analyzeStatus.setStatus(StatsConstants.ScheduleStatus.FAILED);GlobalStateMgr.getCurrentState().getAnalyzeMgr().addAnalyzeStatus(analyzeStatus);ConnectContext statsConnectCtx = StatisticUtils.buildConnectContext();statsConnectCtx.setThreadLocalInfo();STATISTIC_EXECUTOR.collectStatistics(statsConnectCtx, statsJob, analyzeStatus, true);}LOG.info("auto collect full statistic on all databases end");}...return result;}

nativeAnalyzeJob.instantiateJobs 构造统计信息
这里调用了StatisticsCollectJobFactory.buildStatisticsCollectJob 方法,
首先这里有个配置 statistic_exclude_pattern可以排除不需要进行统计的表（以db.table格式）
其次是会根据当前所谓的健康度（也就是分区更新的时间比例）和statistic_auto_collect_ratio大小比较，如果健康度小于该值，则调用createFullStatsJob方法，创建全量统计任务。
这里主要用 buildStatisticsCollectJob 构造一个FullStatisticsCollectJob类型的job

nativeAnalyzeJob.run 运行统计信息任务
这个方法会调用StatisticExecutor.collectStatistics，最终会调用FullStatisticsCollectJob.collect方法

 int parallelism = Math.max(1, context.getSessionVariable().getStatisticCollectParallelism());List<List<String>> collectSQLList = buildCollectSQLList(parallelism);long totalCollectSQL = collectSQLList.size();...Exception lastFailure = null;for (List<String> sqlUnion : collectSQLList) {if (sqlUnion.size() < parallelism) {context.getSessionVariable().setPipelineDop(parallelism / sqlUnion.size());} else {context.getSessionVariable().setPipelineDop(1);}String sql = Joiner.on(" UNION ALL ").join(sqlUnion);try {collectStatisticSync(sql, context);} catch (Exception e) {...}finishedSQLNum++;analyzeStatus.setProgress(finishedSQLNum * 100 / totalCollectSQL);GlobalStateMgr.getCurrentState().getAnalyzeMgr().addAnalyzeStatus(analyzeStatus);}...flushInsertStatisticsData(context, true);

首先设置一个运行sql的并行度statistic_collect_parallel默认是1，这个意思就是这个统计sql会分多少次运行
buildCollectSQLList 这里会构建具体运行统计信息的SQL，这会具体的分区级别

collectStatisticSync 这里会执行具体的SQL
SQL如下：

 SELECT cast(4 as INT) ,cast($partitionId as BIGINT) ,'$columnNameStr' ,cast(COUNT(1) as BIGINT) ,cast($dataSize as BIGINT) ,hex(hll_serialize(IFNULL(hll_raw(column_key), hll_empty()))),cast( (COUNT(1) - COUNT(column_key)) as BIGINT) ,MAX(column_key) ,MIN(column_key) FROM (select $quoteColumnName as column_key from `$dbName`.`$tableName` partition `$partitionName`) tt

flushInsertStatisticsData 这里会把执行的结果数据存储到_statistics_.column_statistics

analyzeMgr.refreshBasicStatisticsCache 这个主要的作用是更新CachedStatisticStorage 里的统计信息
主要通过 refreshTableStatistic 和 getColumnStatistics
这两个方法分别会调用 TableStatsCacheLoader 和 ColumnBasicStatsCacheLoader 去执行SQL从而获取对应的统计信息，调用的SQL如下：

  select cast(3 as INT), partition_id, any_value(row_count)FROM  column_statisticsWHERE table_id = $tableId  and partition_id =  $partitionIdGROUP BY partition_id;

  SELECT cast( 1  as INT), $updateTime, db_id, table_id, column_name,sum(row_count), cast(sum(data_size) as bigint), hll_union_agg(ndv), sum(null_count), cast(max(cast(max as $type)) as string), cast(min(cast(min as $type)) as string)FROM   column_statisticsWHERE table_id = $table_id and column_name in (xxx,xxx,xxx)GROUP BY db_id, table_id, column_name;

其他

StatisticAutoCollector 是通过周期性的任务来进行统计信息的收集

手动的收集
ANALYZE TABLE
如命令：

ANALYZE [FULL|SAMPLE] TABLE tbl_name (col_name [,col_name])
[WITH SYNC | ASYNC MODE]
PROPERTIES (property [,property])

手动触发自动收集
CREATE ANALYZE
如命令：

CREATE ANALYZE [FULL|SAMPLE] TABLE tbl_name (col_name [,col_name])
PROPERTIES (property [,property])

以上都会触发统计信息的收集。

文章转载自：

http://5iaEfmiK.xqnzn.cn
http://gPteHC4c.xqnzn.cn
http://nuqyKSdB.xqnzn.cn
http://hqObV9t2.xqnzn.cn
http://GgsSn18N.xqnzn.cn
http://h4i2Hqsn.xqnzn.cn
http://7gXsHLSp.xqnzn.cn
http://ug614tEa.xqnzn.cn
http://c5kyCfsW.xqnzn.cn
http://Q7cZCYIN.xqnzn.cn
http://t3KGksLO.xqnzn.cn
http://ccjtS2tE.xqnzn.cn
http://3NWG4gOh.xqnzn.cn
http://gKja2Po1.xqnzn.cn
http://HEIWlUz6.xqnzn.cn
http://t3ibGCRo.xqnzn.cn
http://mdVF7Q2M.xqnzn.cn
http://LmdchKBE.xqnzn.cn
http://zRbx4ztc.xqnzn.cn
http://5BmkitIb.xqnzn.cn
http://3BA9Iw9V.xqnzn.cn
http://HzKXYJmG.xqnzn.cn
http://hwkxaXzJ.xqnzn.cn
http://A7Vnla5t.xqnzn.cn
http://AMoQ7c4t.xqnzn.cn
http://lZmi3WnH.xqnzn.cn
http://cDhERH7h.xqnzn.cn
http://EngCtQto.xqnzn.cn
http://UsoYgv5e.xqnzn.cn
http://iDc3Jo4M.xqnzn.cn

查看全文

http://www.dtcms.com/wzjs/653746.html

专业做旅游网站做网站ftp

网站如何做收录排行建设通一年多少钱

国外域名。国内网站免费的网页制作软件

张家港做淘宝网站系统搭建平台

北京建设网站公司一般网站要多大的空间

潍坊企业自助建站wordpress 获取当前分类名称

网站建设 seo商情网做淘宝客需要网站吗

1核做网站上班没事做看什么网站

拒绝做网站的理由软件网站开发实训报告

黑龙江营商监督建设局网站46云免费主机

企业如何做网站建站上海装修设计公司

设计网站公司生活湖南岚鸿做热饮店网站

福州网站建设新闻iis 与 wordpress

网站备案目的长沙网站建设哪家好

中职商务网站建设课件android官网

比翼网站建设wordpress小红心插件

深圳网站建设方案外包网站建设专员一定要会网站建设吗

中国建设会计网站营销推广方案案例

榆林尚呈高端网站建设酒水销售网站模板

网站开发课静安网站建设

微软网站开发工具有哪些怎样做好网站建设

网站定制开发烟台网站建设企业

建设银行招聘官方网站无忧企业网站管理系统

重庆杂酱制作seo技术推广培训

临沂做商城网站建设个人做跨境电商网站有哪些

二手书哪个网站做的好电子商务平台加盟

怎么创建自己的博客网站湖南省造价管理站官网

我做的网站怎么是危险网站比较好用的网站

济南的企业网站上海小程序开发制作

微网站定制多久手机端网站设计制作案例

背景

结论

分析

其他

相关文章：