当前位置: 首页 > wzjs >正文

扬州市住房和城乡建设网站百度seo排名如何提升

扬州市住房和城乡建设网站,百度seo排名如何提升,未来做那些网站致富,学会wordpress建站DataX简介 一、什么是DataX二、DataX设计三、支持的数据源四、框架设计五、运行原理六、DataX和Sqoop对比 一、什么是DataX DataX是阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、OD…

DataX简介

  • 一、什么是DataX
  • 二、DataX设计
  • 三、支持的数据源
  • 四、框架设计
  • 五、运行原理
  • 六、DataX和Sqoop对比

一、什么是DataX

  • DataX是阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。
  • DataX的github地址:https://github.com/alibaba/DataX

二、DataX设计

  • 为了解决异构数据源同步问题,DataX 将复杂的网状的同步链路变成了星型数据链路,DataX 作为中间传输载体负责连接各种数据源。当需要接入一个新的数据源的时候,只需要将此数据源对接到 Datax,便能跟已有的数据源做到无缝数据同步。
    在这里插入图片描述
  • DataX的设计理念是插件式的,这样后续有新的数据库,对源码改动是很少的。
  • 对于一个数据的驱动分为两种:writer和reader
    在这里插入图片描述

三、支持的数据源

  • 对于文档那一列,官网给出了 读和写的配置案例和参数描述
    在这里插入图片描述

四、框架设计

在这里插入图片描述

  • Reader:数据采集模块,负责采集数据源的数据,将数据发送给Framework。
  • Writer:数据写入模块,负责不断向Framework取数据,并将数据写入到目的端。
  • Framework:用于连接reader和writer,作为两者的数据传输通道,并处理缓冲,流控,并发,数据转换等核心技术问题。

五、运行原理

在这里插入图片描述

  • 模块说明:
    • Job:单个作业的管理节点,负责数据清理、子任务划分、TaskGroup监控管理。
    • Task:由Job切分而来,是DataX作业的最小单元,每个Task负责一部分数据的同步工作。
    • Schedule:将Task组成TaskGroup,单个TaskGroup的并发数量为5。
    • TaskGroup:负责启动Task。
  • 举例
    • 举例来说,用户提交了一个 DataX 作业,并且配置了 20 个并发,目的是将一个 100 张
      分表的 mysql 数据同步到 odps 里面。 DataX 的调度决策思路是:
      • 第一步:DataXJob 根据分库分表切分成了 100 个 Task。
      • 第二步:根据 20 个并发,DataX 计算共需要分配 4 个 TaskGroup。
      • 第三步:4 个 TaskGroup 平分切分好的 100 个 Task,每一个 TaskGroup 负责以 5 个并发共计运行 25 个 Task。

六、DataX和Sqoop对比

功能DataXSqoop
运行模式单进程多线程MR(分布式)
MySQL读写单机压力大;
读写力度容易控制;
MR模式重,写出错处理麻烦
Hive读写单机压力大很好
文件格式orc支持orc不支持,可添加
分布式不支持,可以通过调度系统规避支持
流控有流控功能需要定制
统计信息已有一些统计,上报需定制没有,分布式的数据收集不方便
数据校验在core部分有校验功能没有,分布式的数据手机不方便
监控需要定制需要定制
http://www.dtcms.com/wzjs/166963.html

相关文章:

  • 济南网站建设分销商城安卓手机游戏优化器
  • 如何做输入密码进入网站流量大的推广平台有哪些
  • c 手机网模板网站电商运营推广
  • 房屋 哪个网站做的最好阿里云空间+1对1私人专属设计师
  • seo关键词快速提升软件官网百度seo多久能优化关键词
  • 阿里云建站百度收录吗seo百度seo排名优化软件
  • 网站 建设 后台管理程序成人职业培训机构
  • 百度网网站建设的目标推广学院seo教程
  • 学做网站去哪学网店推广联盟
  • 国内做外单的网站有哪些资料最新旅游热点
  • 北京网站建设工作室哪家好疫情防控最新信息
  • 村级网站建设 不断增强网站优化策划书
  • 长沙seo排名公司天津seo诊断
  • logo设计网站哪个好一些镇江百度关键词优化
  • 公司做的网站费用计入什么科目域名申请的流程
  • 移动端的网站模板个人建网站步骤
  • 建设个人博客网站南安网站建设
  • 建设公司怎么做网站运营做一个自己的网站
  • 做网站怎么兼职长沙百度快速优化排名
  • ftp网站备份百度指数数据分析平台
  • 深圳市建设工程质量检测网站网站的宣传推广方式
  • 做空间的网站搜索引擎排名google
  • 怎样获得做网站的客户厦门网站流量优化价格
  • 优惠券怎做网站免费推广引流软件
  • php建网站教程近期国内新闻摘抄
  • 武汉建设网站windows优化大师收费吗
  • 微信扫码即可打开的网站如何做百度推广技巧
  • 图书馆网站建设背景跨境电商平台有哪些?
  • 个人站长怎么做企业网站软文推广发稿平台
  • 做网站建设需要什么工具搜索引擎推广的三种方式