当前位置: 首页 > news >正文

数据仓库:数据地图

数据地图:Data Map所有数仓都应该具备,主要用于元数据管理,可视化呈现

那数据地图包括哪些核心功能呢

1.表及字段的元数据及任务相关的信息

2.表和字段之间的血缘关系

3.所有的上下游,包括应用接口,报表,分析平台等

4.数据探查:数据量,主键,空值,0值,中位数,平均数,最大值,最小值等等

实现这些功能需要从哪些方面来呢

1.采集Hive本身的元数据,表及字段信息(内外表,注释,建表语句等)

2.ETL作业的log信息,获取任务相关的信息

3.表及字段级别的血缘关系(以前调研过atlas,是通过DAG实现的,但页面不太友好)

4.手动维护的数据:为资产分类,划分主题和等缘

应用场景有哪些:

1.帮助新用户快速了解数仓相关的资产

2.根据血缘关系评估影响

3.数据治理,制定对关键模型表的,治理方案

4.合规:可以看哪些部门哪些人拥有权限

http://www.dtcms.com/a/108123.html

相关文章:

  • Vuex中State的三大使用场景深度解析:模板、组件与JS文件的最佳实践
  • 前端面试项目场景题总结
  • Java 8 的流(Stream API)简介
  • 链表(单链表、双链表、循环链表、静态链表)入门
  • Mybatis Plus扩展方法与Pagehelper分页插件
  • 2021-07-05 C#定义一个1到100的数组,用lambda表达式查出尾数是8的数字
  • 瑞昱RTD2556QR显示器驱动芯片
  • ES使用聚合aggregations实战(自用:2025.04.03更新)
  • 机器学习与深度学习3、神经网络原理
  • 子组件使用:visible.sync=“visible“进行双向的绑定导致该弹窗与其他弹窗同时显示的问题
  • 【数据结构】双向链表
  • Spring / Spring Boot 的@MapperScan 和 @Repository
  • Java 可变参数全解析:动态参数传递的实践指南
  • 【MySQL基础-20】MySQL条件函数全面解析:提升查询逻辑的利器
  • 区块链技术如何重塑金融衍生品市场?
  • 防火墙(RHCE)
  • 大数据:信息时代的黄金矿藏
  • Leetcode 合集 -- 排列问题 | 递归
  • k8s statefulset pod重启顺序
  • Qt 读写锁QReadWriteLock
  • 前端计算机网络常问问题大全
  • 如何在服务器端配置SSH以允许密码认证
  • html5炫酷图片悬停效果实现详解
  • 【零基础入门unity游戏开发——2D篇】使用SpriteAtlas(精灵图集)打包图集,减少DrawCall提高性能
  • 第四章、Isaacsim在GUI中构建机器人(1): 添加简单对象
  • SQL复杂查询与性能优化:医药行业ERP系统实战指南
  • Linux 基础入门操作 第九章 进程间通信之有名管道
  • el-select+el-tree、el-select+vl-tree实现下拉树形选择
  • Linux中进程与计划任务
  • SpringMvc获取请求数据