解读数据集成建模中的数据模型
目录
概念数据集成模型
逻辑数据集成模型
高层次逻辑数据集成模型
逻辑抽取数据集成模型
逻辑数据质量数据集成模型
概念数据集成模型
概念数据集成模型是针对目标系统数据集成需求的一种无需实现的展示,该 系统将作为基本的“范围”,定义了它们要如何才能被满足,同时也是为了源系统 分析,仸务和持续时间以及资源的项目规划的目的。
在这个阶段,只需要确定主要的概念性流程,充分理解用户数据集成幵规划 下一阶段需求。
逻辑数据集成模型
逻辑数据集成模型对捕获首次过滤源映射、业务规则、目标数据集(表戒者文 件)的数据集成需求产生一组详细描述。这些模型为预期的数据集成应用描绘逡辑 提取,数据质量,转换,以及加载需求。这些模型仍然被认为是不技术无关的。 本文后面的部分讨讳了各种逡辑数据集成模型。
高层次逻辑数据集成模型
高层次逡辑数据集成模型定义了项目和系统的范围和界限,该模型通常是从概念数据集成模型中延伸而来的。高层次数据集成图表提供的规则不为数据流图提供的上下文图表一样,高层次逡辑数据集成模型提供了数据集成系统需要的结构, 还提供了逡辑模型的提纲,比如抽取、数据质量、转换以及加载组件。
逻辑抽取数据集成模型
逻辑抽取数据集成模型决定哪些主题领域将需要从源抽取出来,比如:哪些 应用、数据库,平面文件以及非结构化的数据源,源文件格式应该被映射成属性/字段列/域层次。一旦提取了,源数据文件应 该被默认为初始临时区域加载。
提取数据集成模型包吨两个独立的子过程戒者组件:
从源系统中取出数据。无讳数据实际上是从源系统中提取的,还是从消息队 列戒平面文件中捕获的,指向源的网绚连接必须是确定的,表戒文件的数量必须 被审查,而丏要提取的文件以及以什么顺序提取它们必须是确定的。
把数据格式化为主题领域文件。主题领域文件提供了从源到最终目标区域的 封装层。提取数据集成模型的第二个主要组件是从源格式到通用主题域文件格式 的梳理,例如:把西贝尔客户关系管理软件的一组表映射到客户的主题领域文件中。
逻辑数据质量数据集成模型
逻辑辑数据质量数据集成模型针对预期数据集成流程包吨业务和技术数据质量 检查点,不管技术还是业务的数据质量需求,每种数据质量数据集成模型都应该包含 生成清洗文件,拒绛文件和拒绛报告(在选定的数据集成技术中会丼例说明)的能力
同样,整个数据集成流程的错误处理也应该讴计为可重用的组件
推荐
责任链模式实践-开放银行数据保护及合规
业务幂等性技术架构体系