当前位置：首页 > news >正文

MySQL按序批量操作大量数据

news 2025/10/9 15:41:51

MySQL按序批量操作大量数据（Java、springboot、mybatisplus、ElasticSearch）

以同步全量MySQL数据到ElasticSearch为例。

核心代码

业务逻辑：

 public boolean syncToElasticsearch() {
        log.info("Starting data synchronization to Elasticsearch.");
        // 获取最大id和最小id
        IdRange idRange = newsMapper.getIdRange();
        log.info("idRange is:{}", JSON.toJSONString(idRange));
        if (idRange == null || idRange.getMinId() <= 0 || idRange.getMaxId() <= 0) {
            log.warn("Invalid id range or no data found in MySQL. Sync process aborted.");
            return false;
        }
        long pageSize = 200L;
        long startId = idRange.getMinId();
        try {
        	// 循环处理所有数据
            while (startId <= idRange.getMaxId()) {
            	// 业务逻辑 可以替换成自己需要的
                log.info("syncToElasticsearch startId:{}", startId);
                List<News> newsList = newsService.getByIdRange(startId, pageSize);
                log.info("syncToElasticsearch newsList size:{}", newsList.size());
                if (CollectionUtils.isEmpty(newsList)) {
                    break;
                }
                newsEsService.bulkUpsertToElasticsearch(getNewsEsDTOList(newsList));

                // 更新startId
                startId = newsList.get(newsList.size() - 1).getId() + 1;
                log.info("Synced {} Newss to Elasticsearch, current id is:{}", newsList.size(), startId);
            }
        } catch (Exception e) {
            log.error("Error occurred during News data synchronization to Elasticsearch.", e);
            return false;
        }
        log.info("Data synchronization to Elasticsearch completed.");
        return true;
    }

mapper：

public interface NewsMapper extends BaseMapper<News> {

    /**
     * 获取最小和最大id值的范围
     *
     * @return
     */
    @Select("SELECT MIN(id) AS minId, MAX(id) AS maxId FROM news")
    IdRange getIdRange();
}

newsService：

    public List<News> getByIdRange(long startId, long pageSize) {
        if (startId <= 0 || pageSize <= 0) {
            return Collections.emptyList();
        }
        return this.list(new LambdaQueryWrapper<News>()
                .ge(News::getId, startId)
                .orderByAsc(News::getId)
                .last("limit " + pageSize));
    }

实体类定义：

@Data
public class IdRange {
    private Long minId;
    private Long maxId;
}

为什么不直接用分页？

页面深度越大查询性能越慢，当表有大量数据时处理后面的数据会很耗时。

查看全文

http://www.dtcms.com/a/5430.html

使用Matlab实现声音信号处理

23.12.10日总结

大一C语言作业 12.8

EasyV易知微助力智慧城市未来趋势发展——数字孪生城市

多汗症的护理重点是什么？

基于Solr的全文检索系统的实现与应用

影视泛目录如何快速提升百度，搜狗权重？

selenium/webdriver运行原理与机制

图文教程：从0开始安装stable-diffusion

CentOS7 OpenSSL升级到OpenSSH9.5p1

Java八股文面试全套真题【含答案】- Spring Security 篇

和鲸科技携手深圳数据交易所，“数据+数据开发者生态”赋能人工智能产业发展

【网络安全】HTTP Slowloris攻击原理解析

数据分析的基本步骤

集成测试如何做？

云原生之深入解析云原生架构的日志监控

【LeetCode刷题笔记（6-1）】【Python】【三数之和】【哈希表】【中等】

IDEA debug窗口左边工具栏隐藏与显示

【答案】2023年国赛信息安全管理与评估第三阶段夺旗挑战CTF（网络安全渗透）

【AI】如何准备mac开发vue项目的环境

网络基础（五）：网络层协议介绍

Makefile基本指令

『npm』一条命令快速配置npm淘宝国内镜像

Vue2面试题：说一下路由模式hash和history的区别？

JVM调优:参数（学习笔记）

vue表单输入绑定

考研真题数据结构

利用闭包与高阶函数实现缓存函数的创建

如何部署自己的服务渲染页面为Pdf文档

Python：用python脚本，自动翻阅Andriod手机小说

MySQL按序批量操作大量数据（Java、springboot、mybatisplus、ElasticSearch）

核心代码

为什么不直接用分页？

相关文章：