当前位置: 首页 > wzjs >正文

细谈电商网站外链建设的策略电脑建设网站服务器

细谈电商网站外链建设的策略,电脑建设网站服务器,微信导航网站有用吗,青岛模板建站公司一、Sqoop 核心理论与应用场景 1.1 设计思想与技术定位 Sqoop 是 Apache 旗下的开源数据传输工具,核心设计基于MapReduce 分布式计算框架,通过并行化的 Map 任务实现高效的数据批量迁移。其特点包括: 批处理特性:基于 MapReduc…

一、Sqoop 核心理论与应用场景

1.1 设计思想与技术定位

Sqoop 是 Apache 旗下的开源数据传输工具,核心设计基于MapReduce 分布式计算框架,通过并行化的 Map 任务实现高效的数据批量迁移。其特点包括:

批处理特性:基于 MapReduce 作业实现导入 / 导出,适合大规模离线数据迁移,不支持实时数据同步

异构数据源连接:支持关系型数据库(如 MySQL、Oracle)与 Hadoop 生态(HDFS、Hive、HBase)间的数据流转。

1.2 业务数据的本质

业务数据指系统正常运行过程中产生的结构化数据,例如:

银行办卡场景:用户提交的身份信息、申请表单等数据写入银行核心系统。

电商交易:订单详情、用户行为日志等构成业务数据主体。
这类数据通常存储在关系型数据库中,需通过 Sqoop 导入大数据平台进行分析。

二、Sqoop 安装与环境配置

2.1 安装步骤

  1. 上传与解压

    tar -zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C /opt/installs/
    
  2. 重命名与环境变量配置

    mv /opt/installs/sqoop-1.4.7.bin__hadoop-2.6.0 /opt/installs/sqoop
    vi /etc/profile
    
     

    在文件末尾添加:

    export SQOOP_HOME=/opt/installs/sqoop
    export PATH=$PATH:$SQOOP_HOME/bin
    
     

    使配置生效:

    source /etc/profile
    
  3. 驱动包配置

    • 将 MySQL 8.0 驱动包(mysql-connector-java-8.0.26.jar)复制到$SQOOP_HOME/lib/目录。
    • 若缺少依赖(如commons-lang),可通过以下命令查找并复制:

      bash

      find /opt/installs -name commons-lang-*.jar
      cp xxx.jar $SQOOP_HOME/lib/
      

三、核心功能实战指南

3.1 基础连接与元数据操作

  1. 查看数据库列表

    sqoop list-databases \
    --connect jdbc:mysql://localhost:3306/ \
    --username root --password 123456
    
  2. 参数文件化(免密执行)
    创建配置文件a.conf

    --connect jdbc:mysql://localhost:3306/
    --username root
    --password 123456
    
     

    执行:

    sqoop --options-file a.conf list-databases
    

3.2 数据导入(Import)

3.2.1 从 MySQL 到 HDFS

命令示例

sqoop import \
--connect jdbc:mysql://localhost:3306/sqoop \
--username root --password 123456 \
--table emp \
--num-mappers 4 \          # 指定4个Map任务并行导入
--where "deptno=10" \      # 过滤条件
--target-dir /user/root/emp \
--as-textfile              # 输出为文本格式(默认)

关键参数解析

参数说明
--split-by指定分片列(默认使用主键,无主键时需显式指定)
--fetch-size单次从数据库读取的记录数,提升 IO 效率
--compress启用压缩(默认 gzip)

注意事项

输出文件以part-m-开头,数量由--num-mappers决定。

数据切割基于分片列取值范围,可能导致分布不均(如主键非连续)。

3.2.2 从 MySQL 到 Hive

命令示例

sqoop import \
--connect jdbc:mysql://localhost:3306/sqoop \
--username root --password 123456 \
--table emp \
--hive-import \              # 启用Hive导入
--hive-table default.emp_hive \  # 指定Hive表名(数据库需提前创建)
--create-hive-table          # 自动创建Hive表(存在则失败)

常见问题

ClassNotFoundException:删除 HDFS 目标目录(hdfs dfs -rm -R /user/root/emp)。

缺少 Hive 依赖:确保$SQOOP_HOME/lib/包含 Hive 相关 Jar 包。

3.3 数据导出(Export)

3.3.1 从 HDFS 到 MySQL

前提条件:MySQL 目标表需提前创建,字段与 HDFS 数据匹配。

sqoop export \
--connect jdbc:mysql://localhost:3306/sqoop \
--username root --password 123456 \
--table emp_export \
--export-dir /user/root/emp \  # HDFS数据源路径
--input-fields-terminated-by ','  # 指定字段分隔符(默认逗号)
--columns "empno,ename,deptno"  # 显式指定列顺序(避免字段错位)
3.3.2 从 Hive 到 MySQL(分析结果落地)

命令示例

sqoop export \
--connect jdbc:mysql://localhost:3306/sqoop \
--username root --password 123456 \
--table emp_analysis \
--hcatalog-database default \  # Hive数据库名
--hcatalog-table emp_hive \    # Hive表名
--input-fields-terminated-by '\001'  # 处理Hive默认分隔符(^A)

配置要点

sqoop-env.sh中添加:export HCAT_HOME=/opt/installs/hive/hcatalog

若遇 JSON 解析错误,需在$SQOOP_HOME/lib/中添加java-json.jar

四、常见问题与解决方案

4.1 连接超时

现象:长时间无操作后连接断开。
解决:修改 MySQL 配置文件/etc/my.cnf,添加:

[mysqld]
wait_timeout=86400  # 设置超时时间为1天(秒)
interactive_timeout=86400

重启 MySQL 服务:systemctl restart mysqld

4.2 无主键表导入

报错java.lang.RuntimeException: No primary key could be found
解决

为表添加主键或唯一索引。

强制指定分片列:--split-by column_name

4.3 列顺序不一致

现象:导出数据与目标表字段错位。
解决:使用--columns "col1,col2,col3"显式指定列顺序。


文章转载自:

http://8T2BN6QD.ysbhj.cn
http://8a4TxmhV.ysbhj.cn
http://Q23yTctR.ysbhj.cn
http://7ggV8XWV.ysbhj.cn
http://YAppyz2f.ysbhj.cn
http://6fvbYKZ3.ysbhj.cn
http://b5acs61I.ysbhj.cn
http://oEsPvmiN.ysbhj.cn
http://GW0ySaDA.ysbhj.cn
http://69HiVQ6z.ysbhj.cn
http://HCO7OxuO.ysbhj.cn
http://MtTw8URz.ysbhj.cn
http://QPPd0mMJ.ysbhj.cn
http://fTtDRjjx.ysbhj.cn
http://ek2i6Ork.ysbhj.cn
http://APkPXKur.ysbhj.cn
http://OnIE3bPR.ysbhj.cn
http://N3NFEZgT.ysbhj.cn
http://W60JgGti.ysbhj.cn
http://cnOLusgz.ysbhj.cn
http://o7uFnziG.ysbhj.cn
http://gqB1BTxo.ysbhj.cn
http://hRkr3jim.ysbhj.cn
http://IDM2s4VU.ysbhj.cn
http://pyNer7S6.ysbhj.cn
http://8MjyyGhm.ysbhj.cn
http://31ayijHK.ysbhj.cn
http://DDnkPZVj.ysbhj.cn
http://jh8bRMEY.ysbhj.cn
http://OFuyTO9e.ysbhj.cn
http://www.dtcms.com/wzjs/661585.html

相关文章:

  • 网站图片alt属性国外做名片网站
  • 中国建设很行河北省分行合作网站推销什么企业做网站和app
  • 婚纱网站php牛商网站建设
  • 有口碑的合肥网站建设网上商城用wordpress
  • 班组建设展板哪个网站有知更鸟WordPress用户中心
  • 网站平台建设如何做一元购物网站
  • 网站屏蔽右键网站设置超链接代码
  • 个旧市城乡建设局网站福田蒙派克图片
  • 聊城哪儿做网站便宜app开发价格公司
  • 生活服务网站开发网站建设公司业务提成多少
  • 做网站 科目西部数码网站开发管理助手
  • 西南大学校园网站建设往年考试卷网站开发用几种字体
  • 个人公司网站模板网站建设捌金手指花总十九
  • 专业的网站建设公泰安网站建设总结
  • 网站百度不到验证码怎么办怎样编辑网页
  • 企业网站优化的三层含义电子商务网站数据库建设
  • 关于网站制作的指标中南建设网官方网站
  • wordpress站点如何添加百度分享代码手机装修设计软件
  • php网站建设的公司国家建设协会官方网站
  • 外贸网站外链怎么做政务移动门户网站建设方案
  • 美丽乡村建设规划文本网站手工制作小船
  • 广州做网站哪个平台好wordpress页面怎么切换
  • 网站建设方案怎么写建网站用什么软件
  • 网站建设团队管理模板苏州网站建设兼职
  • 网站推广策略和效果评价中企动力电话
  • 怀化建设网站旅游公司网站建设ppt
  • 做响应式网站的物流河北建网站
  • 网站上传后怎么打开手机网站 程序
  • 房地产网站建设平台陕西建设网官网证查询
  • 宜春网站建设推广网创是什么