当前位置: 首页 > news >正文

Apache SeaTunnel配置使用案例

前置操作

Apache SeaTunnel详解与部署(最新版本2.3.11)-CSDN博客

mkdir /usr/local/soft/apache-seatunnel-2.3.11/job/

一、MySQL to HDFS

官方配置参考:

MySQL | Apache SeaTunnel

Hdfs文件 | Apache SeaTunnel

1、配置确认

将mysql-connector-java-8.0.15.jar放入到/usr/local/soft/apache-seatunnel-2.3.11/lib/文件夹中

2、启动Hadoop

3、MySQL数据库表创建

确认MySQL数据库wjobs表user中有数据,没有则进行创建

4、创建seatunnel配置文件

cd /usr/local/soft/apache-seatunnel-2.3.11/job/
touch mysql2hdfs.conf

内容如下:

env {parallelism = 2job.mode = "BATCH"
}
source {Jdbc {url = "jdbc:mysql://node11:3306/wjobs"driver = "com.mysql.cj.jdbc.Driver"connection_check_timeout_sec = 100user = "root"password = "root123"table_path = "wjobs.user"query = "select  * from wjobs.user"}
}sink {HdfsFile {fs.defaultFS = "hdfs://node11:9000"path = "/seatunnel_data/user"file_format_type = "text"field_delimiter = "\t"row_delimiter = "\n"custom_filename = truefile_name_expression = "${transactionId}_${now}"filename_time_format = "yyyy.MM.dd"sink_columns = ["id","username","password"]is_enable_transaction = true
}
}

env {parallelism = 2job.mode = "BATCH"
}
source {Jdbc {url = "jdbc:mysql://node11:3306/wjobs"driver = "com.mysql.cj.jdbc.Driver"connection_check_timeout_sec = 100user = "root"password = "root123"table_path = "wjobs.user"query = "select  * from wjobs.user"}
}sink {HdfsFile {fs.defaultFS = "hdfs://node11:9000"path = "/seatunnel_data/user"file_format_type = "text"field_delimiter = "\t"row_delimiter = "\n"is_enable_transaction = true
}
}

 5、执行seatunnel转换命令

cd /usr/local/soft/apache-seatunnel-2.3.11/
./bin/seatunnel.sh --config ./job/mysql2hdfs.conf -m local

注意:此为单次启动,不用启动seatunnel服务 

二、Hive to MySQL

参考:Hive | Apache SeaTunnel

MySQL | Apache SeaTunnel

1、准备数据

确认hive中表及数据、MySQL对应表已创建

2、创建seatunnel配置文件

cd /usr/local/soft/apache-seatunnel-2.3.11/job/
touch hive2mysql.conf

内容如下:

env {parallelism = 2job.mode = "BATCH"
}
source {Hive {table_name = "uoapdb.ext_startup_logs"metastore_uri = "thrift://node11:9083"}
}sink {jdbc {url = "jdbc:mysql://node11:3306/wjobs?useUnicode=true&characterEncoding=UTF-8&rewriteBatchedStatements=true"driver = "com.mysql.cj.jdbc.Driver"user = "root"password = "root123"query = "insert into logs(userId,platform) values(?,?)"}
}

3、 启动Hive

nohup hive --service metastore &
nohup hiveserver2 &

4、执行命令

cd /usr/local/soft/apache-seatunnel-2.3.11/
./bin/seatunnel.sh --config ./job/mysql2hdfs.conf -m local

http://www.dtcms.com/a/283849.html

相关文章:

  • 【Leetcode】栈和队列算法题(逆波兰表达式、二叉树层序遍历、最小栈、栈的压入弹出序列)
  • 贪心算法(排序)
  • 如何通过ATS/HTTPS数据防篡改来加密视频?
  • 部署-k8s和docker的区别和联系
  • 川翔云电脑:云端算力新标杆,创作自由无边界
  • STM32上移植Lua解析器
  • 性能优化实践:Modbus 在高并发场景下的吞吐量提升(二)
  • ClickHouse 多表 JOIN 时 SELECT * 语法错误解析与解决方案
  • Web3智能合约技术论述
  • GraphQL的N+1问题如何被DataLoader巧妙化解?
  • 阿里京东美团即时零售大战,品牌商如何从被动到主动?
  • 多端协同的招聘系统源码开发指南:小程序+APP一体化设计
  • C++性能优化与现代工程实践:打造高效可靠的软件系统
  • Unity_通过鼠标点击屏幕移动屏幕里的一个对象
  • Redis4缓存穿透:布隆过滤器与空对象方案
  • Python爬虫实战:Requests与Selenium详解
  • 电脑截图软件排行榜 Windows和mac电脑截图软件TOP10
  • Perspective:一款开源的交互式分析和数据可视化组件
  • ZKmall开源商城架构助力增长:多端流量聚合与用户体验
  • macOS 12.7.6部署Ollama+Dify避坑指南
  • 集群聊天服务器各个类进行详解
  • LAMP迁移LNMP Nginx多站点配置全流程
  • 大型语言模型(LLM)在网络安全中最具商业价值的应用场景(Grok3 回答 DeepSearch模式)
  • Java-75 深入浅出 RPC Dubbo Java SPI机制详解:从JDK到Dubbo的插件式扩展
  • 新版本flutter(3.32.7) android 端集成百度地图sdk
  • 网络编程7.17
  • cors跨域资源共享
  • Python 网络爬虫 —— 代理服务器
  • 阿里云-通义灵码:隐私保护机制—为数据安全筑起铜墙铁壁
  • Web3.0 实战项目、简历打造、精准投递+面试准备