数据治理域——离线数据开发
摘要
文本主要介绍了离线数据开发相关内容,包括业务与流程、阿里MaxCompute系统设计以及阿里调度系统设计。离线数据开发是大数据开发核心组成部分,用于处理批量数据,支持企业多种需求,其流程涵盖需求调研、数据源接入等环节。阿里MaxCompute系统架构与特点被阐述,调度系统背景及核心设计模型也进行了说明。
1. 离线数据开发业务与流程
离线数据开发是大数据开发中的一个核心组成部分,主要用于处理批量数据(如日志、交易、行为数据等),支持企业的报表统计、数据分析、风控建模、数据仓库建设等需求。下面从业务视角和流程视角分别进行说明: