当前位置：首页 > news >正文

河南省住房城乡建设厅官方网站wordpress新主题去版权

news 2025/9/29 2:26:20

河南省住房城乡建设厅官方网站,wordpress新主题去版权,太原做网站公司,重庆cms建站模板以下是使用 Spark/SparkSQL 连接 MySQL 数据库、添加数据和读取数据的完整示例（需提前准备 MySQL 驱动包）： 一、环境准备 1. 下载 MySQL 驱动 - 下载 mysql-connector-java-8.0.33.jar （或对应版本），放…

以下是使用 Spark/SparkSQL 连接 MySQL 数据库、添加数据和读取数据的完整示例（需提前准备 MySQL 驱动包）：

一、环境准备

1. 下载 MySQL 驱动

- 下载 mysql-connector-java-8.0.33.jar （或对应版本），放入 Spark 的 jars 目录，或提交任务时用 --jars 指定路径。

2. 启动 SparkSession

scala

import org.apache.spark.sql.SparkSession

val spark = SparkSession.builder()

.appName("Spark MySQL Demo")

.master("local[*]") // 本地模式，集群环境需调整

.getOrCreate()

二、连接 MySQL 并读取数据

方式 1：使用 spark.read.jdbc 读取

scala

// 配置连接参数

val jdbcUrl = "jdbc:mysql://localhost:3306/test_db"

val tableName = "users"

val connectionProperties = new java.util.Properties()

connectionProperties.put("user", "root")

connectionProperties.put("password", "your_password")

connectionProperties.put("driver", "com.mysql.cj.jdbc.Driver")

// 读取表数据

val df = spark.read.jdbc(jdbcUrl, tableName, connectionProperties)

// 显示数据

df.show()

方式 2：使用 SparkSQL 执行查询

scala

// 直接执行 SQL 查询（需指定完整表名）

val queryDF = spark.read.jdbc(

jdbcUrl,

s"(SELECT id, name FROM $tableName WHERE age > 18) AS temp", // 子查询防注入

connectionProperties

)

queryDF.show()

三、向 MySQL 插入数据

场景 1：写入新表（自动创建）

scala

// 创建示例数据

val data = Seq(

(3, "Alice", 25, java.sql.Timestamp.valueOf("2023-01-01 00:00:00")),

(4, "Bob", 30, java.sql.Timestamp.valueOf("2023-02-02 00:00:00"))

)

val schema = StructType(

Seq(

StructField("id", IntegerType, false),

StructField("name", StringType, true),

StructField("age", IntegerType, true),

StructField("create_time", TimestampType, true)

)

val insertDF = spark.createDataFrame(data, schema)

// 写入 MySQL（若表不存在则自动创建，需确保库存在）

insertDF.write.format("jdbc")

.option("url", jdbcUrl)

.option("dbtable", "users") // 表名

.option("user", "root")

.option("password", "your_password")

.option("driver", "com.mysql.cj.jdbc.Driver")

.mode("append") // 追加模式（可选：overwrite/ignore/replace）

.save()

场景 2：向现有表追加数据

scala

// 读取现有数据并新增记录

val existingDF = spark.read.jdbc(jdbcUrl, tableName, connectionProperties)

val newData = Seq((5, "Charlie", 35, java.sql.Timestamp.valueOf("2023-03-03 00:00:00")))

val newDF = spark.createDataFrame(newData, schema)

// 合并后写入（追加模式）

val combinedDF = existingDF.union(newDF)

combinedDF.write.jdbc(

jdbcUrl,

tableName,

connectionProperties,

"append" // 模式可通过第四个参数指定

)

四、关键参数说明

mode：

写入模式： append （追加）、 overwrite （覆盖）、 ignore （忽略冲突）

dbtable ：

目标表名（支持库名.表名格式，如 test_db.users ）

partitionColumn ：

分区列（大数据量时用于并行读取，需配合 lowerBound / upperBound ）

fetchSize ：

每次从数据库拉取的行数（优化性能，默认 1000）

createTableOptions ：

建表时的额外参数（如 ENGINE=InnoDB CHARSET=utf8 ）

五、注意事项

1. 驱动版本匹配

- MySQL 8.0+ 需使用 mysql-connector-java-8.0+ ，低版本数据库用 5.1.x 驱动。

2. 权限问题

- 确保 MySQL 用户有 INSERT / SELECT 权限：

sql

GRANT INSERT, SELECT ON test_db.* TO 'user'@'localhost';

3. 大数据量优化

- 并行写入：通过 numPartitions 和 partitionColumn 分区（需指定主键或索引列）。

- 批量提交：设置 batchSize=1000 减少连接开销：

scala

.option("batchSize", "1000")

4. 类型映射

- Spark 与 MySQL 类型需匹配（如 StringType → VARCHAR ， TimestampType → DATETIME ）。

六、完整示例（Scala 版）

scala

import org.apache.spark.sql.{SparkSession, Row}

import org.apache.spark.sql.types.{StructType, StructField, IntegerType, StringType, TimestampType}

import java.sql.Timestamp

// 1. 初始化 SparkSession

val spark = SparkSession.builder()

.appName("MySQL Demo")

.master("local[*]")

.getOrCreate()

// 2. 定义连接参数

val jdbcUrl = "jdbc:mysql://localhost:3306/test_db"

val tableName = "users"

val props = new java.util.Properties()

props.setProperty("user", "root")

props.setProperty("password", "your_password")

props.setProperty("driver", "com.mysql.cj.jdbc.Driver")

// 3. 读取数据

val df = spark.read.jdbc(jdbcUrl, tableName, props)

println("读取的数据：")

df.show()

// 4. 准备插入数据

val newData = Seq(

Row(6, "David", 28, new Timestamp(System.currentTimeMillis()))

)

val schema = new StructType(

Array(

StructField("id", IntegerType, nullable = false),

StructField("name", StringType, nullable = true),

StructField("age", IntegerType, nullable = true),

StructField("create_time", TimestampType, nullable = true)

)

val insertDF = spark.createDataFrame(spark.sparkContext.parallelize(newData), schema)

// 5. 插入数据（追加模式）

insertDF.write.jdbc(jdbcUrl, tableName, "append", props)

println("数据插入完成！")

// 6. 验证插入结果

val updatedDF = spark.read.jdbc(jdbcUrl, tableName, props)

updatedDF.show()

// 7. 停止 SparkSession

spark.stop()

执行后可通过 MySQL 客户端验证数据是否正确写入。

查看全文

http://www.dtcms.com/a/417749.html

公司怎么搭建自己网站怎样建设网赌网站

织梦网站联系我们的地图怎么做佛山网站建设业务员

通过模版做网站白宫 wordpress

网站建设运城玉林做网站优化推广

什么网站是做汽车装饰配件的天津建设工程竣工备案公示网站

秦皇岛学网站建设北京建网站公司飞沐

手机建设网站策划书乡村振兴网站建设

济南科技市场做网站奎屯市网站

dedecms做电影网站信息网站有哪些

酒泉如何做百度的网站南京网站建设雷仁

怎么关键词优化网站西地那非片吃了多久会硬起来

免费推广网站短视频南三环做网站的公司

沙坪坝集团网站建设专业网页制作哪家好

淘宝内部券网站建设家在龙岗

手机网站营销页网站是数据

宁波学校网站建设哪个网站做ppt好

福州网站建设fjfzwl千万别在百度上搜别人的名字

建设银行etc信用卡申请网站免费工作总结ppt模板下载

360网站建设商家广西网站seo

温州网站建设策划做618购物网站的总结

郑州高端模板建站教育网站的开发与建设论文

国外电商网站有哪些跨界营销案例

php 英文商城网站建设线上外贸平台有哪些

查询网站dns服务器投融网站建设方案

厦门网站建设门户做网站的电话

怎么样建设网站网站全是广告的网站

南通网站建打造自己的网站

南京网站排名优化费用组织建设包括哪些内容

正品海外购网站有哪些网站开发人员分工

小企业网站建设有什么用seo与网站建设

相关文章：