当前位置: 首页 > news >正文

数仓架构 数据表建模

数仓架构

主要用来描述 数据加工的实时链路 和 离线链路之间的关系,即 流批 关系;
lamda 架构, 是两条路, 实时计算式的, 维护数据的实时性。然后每天经过批计算后, 覆盖实时的计算结果。 保证数据准确性。

kappa架构, 即流批一体了

数据建模

星型模型是数据仓库中最简单的模型,由1张事实表和1级维表构成,适合大数据处理,但存在数据冗余。雪花模型则通过维表的层次化减少了数据存储量,提高了查询性能,但查询效率较低。星座模型是星型模型的扩展,多张事实表共享维表,适用于复杂数据关系。选择模型时应根据场景权衡数据冗余、查询效率和扩展性。

主要说明事实表和维度表之间的关系。

星型模型如下

在这里插入图片描述

雪花模型

当一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的"层次"区域,这些被分解的表都连接到主维表而不是事实表。

在这里插入图片描述

星座模型

星座模型也是星型模型的扩展。区别是星座模型中存在多张事实表,不同事实表之间共享维表信息,常用于数据关系更复杂的场景。其经常被称为星系模型。

http://www.dtcms.com/a/314286.html

相关文章:

  • 飞算 JavaAI:给需求分析装上 “智能大脑“
  • 0基礎網站開發技術教學(三) --(後端PHP篇)-- [內有2025最新可用 phpstudy2018下載鏈接]
  • 软件设计 VS 软件需求:了解成功软件开发外包的关键差异
  • 软件需求关闭前的质量评估标准是什么
  • 【LeetCode刷题集】--排序(一)
  • 深入解析SmolVLA:VLM与动作专家间的注意力机制交互
  • 嵌入式硬件中三极管原理分析与控制详解
  • sqli-libs通关教程(31-40)
  • Pytorch-速查表-常用层和模块以及使用方法
  • FPGA实现Aurora 8B10B数据回环传输,基于GTP高速收发器,提供6套工程源码和技术支持
  • 三防平板电脑是什么?这款三防平板支持红外测温!
  • Ribbon 核心原理与架构详解:服务负载均衡的隐形支柱
  • 生产环境中基于Istio的Kubernetes多集群灰度发布架构实战经验分享
  • Django 性能优化详解:从数据库到缓存,打造高效 Web 应用
  • JavaScript案例(待办事项列表)
  • vue--for循环中使用子组件,ref应该如果调用
  • SP30D120CTT大电流碳化硅二极管全面解析:TO-247封装的高功率解决方案
  • Minio部署和客户端使用 - 版本 2025-05-24T17-08-30Z
  • 计算机网络:网络号和网络地址的区别
  • [激光原理与应用-135]:光学器件 - 透镜的本质是利用材料对光的折射特性,通过特定形状的表面设计,实现对光线的会聚、发散或成像控制的光学元件
  • HTTP各个版本对比
  • 【YOLO11】【DeepSort】【NCNN】使用YOLOv11和DeepSort进行行人目标跟踪。(基于ncnn框架,c++实现)
  • 文件与目录操作命令
  • Kubernetes(k8s)之认识Pod
  • k8s简介
  • Go语言 并发安全sync
  • 深度解析:CPU 与 GPU 上的张量运算,为何“快”与“慢”并非绝对?
  • 亚马逊撤离Google购物广告:重构流量生态的战略博弈
  • 从零开始搞定类与对象(中)
  • 企业架构被大模型重构:大模型驱动下的数字基建革命与机遇