当前位置：首页 > wzjs >正文

重庆电脑网站建设柯桥做网站的公司

wzjs 2025/9/14 10:56:54

重庆电脑网站建设,柯桥做网站的公司,谷歌seo外包公司哪家好,业务外包简介紧接着上期关于定义如何一个简单的插件，本期了解下关系型数据库的数据读取和数据写入。环境 Windows10 (linux中命令相似，为了方面调试就用windows的)JDK(1.8以上，推荐1.8)Python(2或3都可以)Apache Maven (推荐3.x版本)IntelliJ IDEA…

简介

紧接着上期关于定义如何一个简单的插件，本期了解下关系型数据库的数据读取和数据写入。

环境

Windows10 (linux中命令相似，为了方面调试就用windows的)
JDK(1.8以上，推荐1.8)
Python(2或3都可以)
Apache Maven (推荐3.x版本)
IntelliJ IDEA 2023.2.2 （IDE没要求，能打开maven项目就行）
源码下载地址

内容

DataX运行的时序图

对于关系型数据库DataX内有一个公共的调用工具。

CommonRdbmsReader

包含两个内部类Job和Task的公共类，分别用于处理作业级别和任务级别的操作。

Job类负责作业的初始化、预检查、拆分、以及作业结束时的清理工作。

init(Configuration originalConfig): 初始化作业配置。
preCheck(Configuration originalConfig, DataBaseType dataBaseType): 预检查数据库连接和查询语句的有效性。
split(Configuration originalConfig, int adviceNumber): 将作业拆分为多个任务。
post(Configuration originalConfig)和destroy(Configuration originalConfig): 作业结束时的清理工作。

Task类负责单个任务的初始化、数据读取和任务结束时的清理工作。

init(Configuration readerSliceConfig): 初始化任务配置，包括数据库连接信息。
startRead(Configuration readerSliceConfig, RecordSender recordSender, TaskPluginCollector taskPluginCollector, int fetchSize): 开始读取数据，执行查询并将结果发送到记录发送器。
post(Configuration originalConfig)和destroy(Configuration originalConfig): 任务结束时的清理工作。
transportOneRecord(RecordSender recordSender, ResultSet rs, ResultSetMetaData metaData, int columnNumber, String mandatoryEncoding, TaskPluginCollector taskPluginCollector): 处理并传输一条记录。
buildRecord(RecordSender recordSender, ResultSet rs, ResultSetMetaData metaData, int columnNumber, String mandatoryEncoding, TaskPluginCollector taskPluginCollector): 根据结果集构建记录。

核心代码

 public void startRead(Configuration readerSliceConfig,RecordSender recordSender,TaskPluginCollector taskPluginCollector, int fetchSize) {// 从配置中获取查询SQL语句String querySql = readerSliceConfig.getString(Key.QUERY_SQL);// 从配置中获取表名String table = readerSliceConfig.getString(Key.TABLE);// 将任务详情添加到性能跟踪实例中PerfTrace.getInstance().addTaskDetails(taskId, table + "," + basicMsg);// 打印日志，表示开始读取记录LOG.info("Begin to read record by Sql: [{}\n] {}.",querySql, basicMsg);// 创建一个性能记录对象，记录SQL查询阶段PerfRecord queryPerfRecord = new PerfRecord(taskGroupId,taskId, PerfRecord.PHASE.SQL_QUERY);queryPerfRecord.start();// 获取数据库连接Connection conn = DBUtil.getConnection(this.dataBaseType, jdbcUrl,username, password);// session config .etc relatedDBUtil.dealWithSessionConfig(conn, readerSliceConfig,this.dataBaseType, basicMsg);int columnNumber = 0;ResultSet rs = null;try {rs = DBUtil.query(conn, querySql, fetchSize);queryPerfRecord.end();ResultSetMetaData metaData = rs.getMetaData();columnNumber = metaData.getColumnCount();//这个统计干净的result_Next时间PerfRecord allResultPerfRecord = new PerfRecord(taskGroupId, taskId, PerfRecord.PHASE.RESULT_NEXT_ALL);allResultPerfRecord.start();long rsNextUsedTime = 0;long lastTime = System.nanoTime();while (rs.next()) {rsNextUsedTime += (System.nanoTime() - lastTime);this.transportOneRecord(recordSender, rs,metaData, columnNumber, mandatoryEncoding, taskPluginCollector);lastTime = System.nanoTime();}allResultPerfRecord.end(rsNextUsedTime);//目前大盘是依赖这个打印，而之前这个Finish read record是包含了sql查询和result next的全部时间LOG.info("Finished read record by Sql: [{}\n] {}.",querySql, basicMsg);}catch (Exception e) {throw RdbmsException.asQueryException(this.dataBaseType, e, querySql, table, username);} finally {DBUtil.closeDBResources(null, conn);}}

这段Java代码是一个数据库读取任务的核心实现，用于从数据库中读取数据。它实现了startRead方法，该方法接收几个参数，包括配置信息、记录发送器、任务插件收集器以及每次查询的记录数。

方法参数

readerSliceConfig：包含数据库连接和查询配置的Configuration对象。
recordSender：用于发送读取到的记录的对象。
taskPluginCollector：用于收集任务插件的错误信息的对象。
fetchSize：每次查询数据库时获取的记录数。

1.变量初始化

从配置中获取SQL查询语句和表名。

String querySql = readerSliceConfig.getString(Key.QUERY_SQL);
String table = readerSliceConfig.getString(Key.TABLE);

2.性能跟踪

使用PerfTrace和PerfRecord进行性能跟踪，记录任务开始时间和详细信息。

PerfTrace.getInstance().addTaskDetails(taskId, table + "," + basicMsg);
LOG.info("Begin to read record by Sql: [{}\n] {}.", querySql, basicMsg);
PerfRecord queryPerfRecord = new PerfRecord(taskGroupId, taskId, PerfRecord.PHASE.SQL_QUERY);
queryPerfRecord.start();

3.数据库连接

使用DBUtil工具类获取数据库连接，并根据配置处理会话配置。

Connection conn = DBUtil.getConnection(this.dataBaseType, jdbcUrl, username, password);
DBUtil.dealWithSessionConfig(conn, readerSliceConfig, this.dataBaseType, basicMsg);

4.查询数据库

执行SQL查询并获取结果集，记录查询结束时间，获取结果集的元数据（列数）。

int columnNumber = 0;
ResultSet rs = null;
try {rs = DBUtil.query(conn, querySql, fetchSize);queryPerfRecord.end();ResultSetMetaData metaData = rs.getMetaData();columnNumber = metaData.getColumnCount();

5.读取结果集

使用while循环遍历结果集，记录每条记录的读取时间，并通过transportOneRecord方法发送记录。
transportOneRecord表示从数据库查询结果集中读取数据，并根据数据类型将其转换为相应的数据列，最终构建一个完整的记录对象

PerfRecord allResultPerfRecord = new PerfRecord(taskGroupId, taskId, PerfRecord.PHASE.RESULT_NEXT_ALL);
allResultPerfRecord.start();
long rsNextUsedTime = 0;
long lastTime = System.nanoTime();
while (rs.next()) {rsNextUsedTime += (System.nanoTime() - lastTime);this.transportOneRecord(recordSender, rs, metaData, columnNumber, mandatoryEncoding, taskPluginCollector);lastTime = System.nanoTime();
}
allResultPerfRecord.end(rsNextUsedTime);
LOG.info("Finished read record by Sql: [{}\n] {}.", querySql, basicMsg);

6.异常处理

捕获异常并抛出自定义的数据库查询异常，最后确保关闭数据库连接。

} catch (Exception e) {throw RdbmsException.asQueryException(this.dataBaseType, e, querySql, table, username);
} finally {DBUtil.closeDBResources(null, conn);
}

总结

这段代码的主要功能是从数据库中读取数据，并通过性能跟踪记录查询和读取过程的时间。它使用了JDBC来连接和查询数据库，并通过RecordSender发送读取到的记录。代码中还包含了异常处理和资源释放的逻辑，确保在发生异常时能够正确处理并释放数据库连接。

CommonRdbmsWriter

也包含两个内部类Job和Task的公共类，分别用于处理作业级别和任务级别的操作。

Job类负责作业的初始化、预检查、拆分、以及作业结束时的清理工作。

init(Configuration originalConfig)：初始化作业配置。
writerPreCheck(Configuration originalConfig, DataBaseType dataBaseType)：进行写前检查，包括SQL语法检查和权限检查。
prepare(Configuration originalConfig)：执行作业前的准备工作，如执行预SQL语句。
split(Configuration originalConfig, int mandatoryNumber)：将作业配置分割成多个任务配置。
post(Configuration originalConfig)：执行作业后的操作，如执行后SQL语句。
destroy(Configuration originalConfig)：销毁作业资源。

Task类负责单个任务的初始化、数据读取和任务结束时的清理工作。

init(Configuration writerSliceConfig)：初始化任务配置。
prepare(Configuration writerSliceConfig)：执行任务前的准备工作。
startWriteWithConnection(RecordReceiver recordReceiver, TaskPluginCollector taskPluginCollector, Connection connection)：使用给定的数据库连接开始写入数据。
startWrite(RecordReceiver recordReceiver, Configuration writerSliceConfig, TaskPluginCollector taskPluginCollector)：开始写入数据。
post(Configuration writerSliceConfig)：执行任务后的操作。
destroy(Configuration writerSliceConfig)：销毁任务资源。
doBatchInsert(Connection connection, List<Record> buffer)：批量插入数据。
doOneInsert(Connection connection, List<Record> buffer)：逐条插入数据。
fillPreparedStatement(PreparedStatement preparedStatement, Record record)：填充PreparedStatement对象。
fillPreparedStatementColumnType(PreparedStatement preparedStatement, int columnIndex, int columnSqltype, String typeName, Column column)：根据字段类型填充PreparedStatement对象。
calcWriteRecordSql()：计算写入记录的SQL语句。
calcValueHolder(String columnType)：计算值占位符。

核心代码

 public void startWriteWithConnection(RecordReceiver recordReceiver, TaskPluginCollector taskPluginCollector, Connection connection) {System.err.println("CommonRdbmsWriter Task startWriteWithConnection");this.taskPluginCollector = taskPluginCollector;// 用于写入数据的时候的类型根据目的表字段类型转换this.resultSetMetaData = DBUtil.getColumnMetaData(connection,this.table, StringUtils.join(this.columns, ","));// 写数据库的SQL语句calcWriteRecordSql();List<Record> writeBuffer = new ArrayList<Record>(this.batchSize);int bufferBytes = 0;try {Record record;while ((record = recordReceiver.getFromReader()) != null) {if (record.getColumnNumber() != this.columnNumber) {// 源头读取字段列数与目的表字段写入列数不相等，直接报错throw DataXException.asDataXException(DBUtilErrorCode.CONF_ERROR,String.format("列配置信息有错误. 因为您配置的任务中，源头读取字段数:%s 与 目的表要写入的字段数:%s 不相等. 请检查您的配置并作出修改.",record.getColumnNumber(),this.columnNumber));}writeBuffer.add(record);bufferBytes += record.getMemorySize();if (writeBuffer.size() >= batchSize || bufferBytes >= batchByteSize) {doBatchInsert(connection, writeBuffer);writeBuffer.clear();bufferBytes = 0;}}if (!writeBuffer.isEmpty()) {doBatchInsert(connection, writeBuffer);writeBuffer.clear();bufferBytes = 0;}} catch (Exception e) {throw DataXException.asDataXException(DBUtilErrorCode.WRITE_DATA_ERROR, e);} finally {writeBuffer.clear();bufferBytes = 0;DBUtil.closeDBResources(null, null, connection);}}

方法参数

recordReceiver：用于接收从数据源读取的数据记录。
taskPluginCollector：用于收集任务执行过程中的信息，比如错误信息。
connection：数据库连接对象，用于与数据库进行交互。

1.初始化任务收集器

将传入的任务收集器赋值给当前对象的成员变量。

this.taskPluginCollector = taskPluginCollector;

2.获取列元数据

调用DBUtil工具类的方法，获取目标表的列元数据，包括列名、类型等。

this.resultSetMetaData = DBUtil.getColumnMetaData(connection, this.table, StringUtils.join(this.columns, ","));

3.计算写入SQL语句

调用方法计算写入数据库的SQL语句。

calcWriteRecordSql();

4.初始化缓冲区

初始化一个记录列表作为缓冲区，用于批量写入数据。

List<Record> writeBuffer = new ArrayList<Record>(this.batchSize);
int bufferBytes = 0;

5.读取并写入数据

从recordReceiver中读取记录，直到没有更多记录。
检查读取的记录列数是否与目标表列数一致，不一致则抛出异常。
将记录添加到缓冲区，并计算缓冲区的大小。
当缓冲区达到指定大小（行数或字节数）时，调用doBatchInsert方法批量写入数据，并清空缓冲区

Record record;
while ((record = recordReceiver.getFromReader()) != null) {if (record.getColumnNumber() != this.columnNumber) {throw DataXException.asDataXException(DBUtilErrorCode.CONF_ERROR, String.format("列配置信息有错误. 因为您配置的任务中，源头读取字段数:%s 与 目的表要写入的字段数:%s 不相等. 请检查您的配置并作出修改.", record.getColumnNumber(), this.columnNumber));}writeBuffer.add(record);bufferBytes += record.getMemorySize();if (writeBuffer.size() >= batchSize || bufferBytes >= batchByteSize) {doBatchInsert(connection, writeBuffer);writeBuffer.clear();bufferBytes = 0;}
}

6.处理剩余记录

如果在读取完所有记录后，缓冲区中还有剩余的记录，则进行最后一次批量写入。

if (!writeBuffer.isEmpty()) {doBatchInsert(connection, writeBuffer);writeBuffer.clear();bufferBytes = 0;
}

7.异常处理

捕获并抛出自定义的DataX异常。

} catch (Exception e) {throw DataXException.asDataXException(DBUtilErrorCode.WRITE_DATA_ERROR, e);
}

8.资源清理

清空缓冲区，释放数据库连接资源。

finally {writeBuffer.clear();bufferBytes = 0;DBUtil.closeDBResources(null, null, connection);
}

总结

这段代码的主要目的是从recordReceiver中读取记录读取数据，然后按照配置的批量大小和字节数，将数据写入目标数据库。

结语

对于关系型数据库DataX基本都实现了，如果有定制化需求可以通过对上面的代码模块进行复制后改造来实现。同时DataX还支持非结构化存储（图片、文件、视频等）数据同步，可参考plugin-unstructured-storage-util模块。

文章转载自：

http://9J39VVAV.dthyq.cn
http://5jrGY7At.dthyq.cn
http://XS9vbQzl.dthyq.cn
http://Vwm1lekC.dthyq.cn
http://aqbl5Lfp.dthyq.cn
http://90g4nkZ3.dthyq.cn
http://F0ymYl7K.dthyq.cn
http://uuJvls9z.dthyq.cn
http://Fqjm7xSY.dthyq.cn
http://WOgEhPhW.dthyq.cn
http://GDZ8W7a6.dthyq.cn
http://THmUrxg0.dthyq.cn
http://ukkaeQaZ.dthyq.cn
http://n8gkWRVT.dthyq.cn
http://E9fet52D.dthyq.cn
http://5NVc5Ghc.dthyq.cn
http://FmrWvwyr.dthyq.cn
http://F7O7FCD8.dthyq.cn
http://8JBhBHGI.dthyq.cn
http://IE0dCQRC.dthyq.cn
http://zcLlNkv8.dthyq.cn
http://UQT8GJYr.dthyq.cn
http://ALnvMGwh.dthyq.cn
http://91XQCqDq.dthyq.cn
http://egae791O.dthyq.cn
http://mATU9U9T.dthyq.cn
http://FJbLZ1A9.dthyq.cn
http://dsllKcdK.dthyq.cn
http://0zIX9ymv.dthyq.cn
http://wGOo6Ton.dthyq.cn

查看全文

http://www.dtcms.com/wzjs/728982.html

云南网网站网站设计免费模板

上海公司做网站的中国正能量不良网站直接进入

如何建立asp网站亿图

同德县wap网站建设公司文创产品设计说明模板

电子工程设计网站顶格处罚鼠头鸭脖涉事企业

怎么做网站报价表网站制作外包公司

网站子栏目设计做网站公司赚钱么

徐州市建设局官方网站网络营销策略是什么

如何建立优秀企业网站企业网站建设与网页设计

网站关键词之间用什么符号隔开运营公司

公司网站建设一定要求原图吗一个网站如何推广

锦州做网站哪家好个人网站推广费用

厦门网站推广步骤机构360浏览器直接进入网站

有哪些好的响应式网站有哪些贵州今天刚刚发生的新闻

建设银行山西招聘网站wordpress获取附件

漯河网站超市建设邢台专业做网站

江苏网站建设流程高明网站设计报价

wordpress子目录站点外贸网站的作用

企业网站被转做非法用途网站设计策划书3000字

深圳模具外贸网站建设wordpress press

做个公司网站一般需要多少钱wordpress偽靜態

网站链接怎么做参考文献北京房价

中讯科技-运城网站建设会外语和做网站

做网站公司需要什么资质网站做seo收录

山西网站建设企业连云港网站关键字优化市场

网站建设毕业设计心得合肥网络开发公司

用什么网站做问卷node.js可以做网站么

做理财网站有哪些网站开发备案认证

营销型企业网站一般具有哪些功能政务网站建设浙江

衡水哪儿专业做网站怎么进不了深圳市建设局网站

简介

环境

内容

CommonRdbmsReader

核心代码

方法参数

1.变量初始化

2.性能跟踪

3.数据库连接

4.查询数据库

5.读取结果集

6.异常处理

总结

CommonRdbmsWriter

核心代码

方法参数

1.初始化任务收集器

2.获取列元数据

3.计算写入SQL语句

4.初始化缓冲区

5.读取并写入数据

6.处理剩余记录

7.异常处理

8.资源清理

总结

结语

相关文章：