当前位置: 首页 > news >正文

大数据测试中,数据仓库表类型有哪些?

本文我们一起了解一下数据仓库测试的对象,直白一点讲就是一张表,这张表分为以下几种类型:

全量表:没有分区的表,数据全量更新或者增量合并,我们通常理解就是把这些数据放到了一个文件夹里面。这样会有什么好处呢?全量表查询的效率非常高,成本比较低。但是它不能反应数据状态,只保存最新状态的数据。

分区表:有分区的表,比如我们把订单信息放到了几个文件夹去储存,一个文件夹按照天去切分。分区表分为两种,一种是增量的,每天存一份。第二种是全量更新,比如我们可能会把历史之前所有的数据存储在某一天的数据里面。

分区表的好处是可以查询到历史数据的状态以及变化过程,但是可以保存历史数据的状态,一般使用日期或者地区作为分区条件。有一个缺点是在一些时间节点上容易产生数据漂移。

临时表:放在tmp的表,这种表一般是测试或开发临时保存一些数据时用的,一般不需要我们去测试。一般只会保存很短的时间,过了时间系统会自动清掉。

拉链表:是一种维护历史状态,以及最新状态数据的一种表,一般只会插入更新有状态变化的数据,保存数据的历史状态,不变更。这样做的好处就是节省存储资源。

外部表:是建表的时候被external 修饰的表。删除外部表的时候,只会删除元数据,数据本身不删除,外部表可以自己指定路径,跨部门使用比较安全。

后面会带大家继续了解大数据测试,欢迎大家继续关注。

(本系列文章根据《优品软件培育计划》公益直播内容整理,观看直播回放可以私信我获取观看链接。)

相关文章:

  • 深度学习中关于超参数的解释
  • vm+centos虚拟机
  • Kotlin中RxJava用法
  • SQL 中为什么参数多了not in 比 in 慢多了,怎么优化
  • JavaScript系列05-现代JavaScript新特性
  • .NET10 - 预览版1新功能体验(一)
  • Generalized Sparse Additive Model with Unknown Link Function
  • vue全局注册组件
  • Y3学习打卡
  • 【3-3】springcloud
  • 【每日学点HarmonyOS Next知识】网络请求回调toast问题、Popup问题、禁止弹窗返回、navigation折叠屏不显示返回键、响应式布局
  • Deepseek:物理神经网络PINN入门教程
  • element-push el-date-picker日期时间选择器,禁用可选中的时间 精确到分钟
  • OpenCV计算摄影学(11)色调映射算法类cv::TonemapDrago
  • 【量化策略】网格交易策略
  • 本地安装git
  • Sass基础
  • Django框架下html文件无法格式化的解决方案
  • 初识Qt · Qt的基本认识和基本项目代码解释
  • Firefox缩小标签页高度以及自定义调整
  • 卢正已任上海市司法局党委委员、副局长
  • 印度32座机场暂停民用航班运营,印称在边境多处发现无人机
  • 【社论】职业上新,勇于“尝新”
  • 马上评丨维护学术诚信别陷入“唯AI检测”误区
  • 梵蒂冈选出新教皇,外交部:望新教皇推动中梵关系不断改善
  • 国家发改委:美芯片药品等领域关税影响全球科技发展,损害人类共同利益