当前位置: 首页 > wzjs >正文

百度网站推广申请竞价服务托管公司

百度网站推广申请,竞价服务托管公司,南宁哪里有网站建设培训班,聊城建设网站业务分析 内部平台需要一个导出mysql数据到excel的方法,所以使用了EasyExcel 因为EasyExcel的sheet页是放到一个List里面的,如果把百万量级的数据放到sheet页中全量写入会有OOM风险,所以最终选择的方案是分sheet页写入 同时因为该平台是多…

业务分析

内部平台需要一个导出mysql数据到excel的方法,所以使用了EasyExcel

因为EasyExcel的sheet页是放到一个List里面的,如果把百万量级的数据放到sheet页中全量写入会有OOM风险,所以最终选择的方案是分sheet页写入

同时因为该平台是多用户的,所以不仅要控制当前方法的sheet页的总量,还要估算多用户场景下sheet页加起来的量大小,如果规定每个写入的sheet页的量级为50w,那么10个用户并行导出的时候是不是500w的量级?

那就会出现OOM问题,为了严格控制sheet页的和总量,就要细致化到控制每个线程的每次写入的sheet页的量

为了优化多线程,还可以上深分页优化来进一步优化

多优化逻辑:线程+多sheet页+深分页


代码逻辑解析

我会开3个线程,然后sheet页按照10w为一批写入,3个线程就是30w

0-30w就用主线程,30w-60w就用两个线程,60w以后就用3个线程

本次要导出的是90w量级的数据,我们严格控制sheet也就是每次写入的一批数据量batchSize为10w

导出数据总量、每批数据量,算出写入sheet页的总批次

总批次/要开启的线程数,得到每个线程要写入的批次

有3个线程,每个线程的第一次查询要拿到第一批的数据的最后一个数据的id(sql是根据id排序的)

SQL: @Select("select * from excel where id >#{lastMaxId} order by id limit #{batchsize} ")

然后每个线程除了第一次查询,其他查询都可以优化深分页

为什么我要写入多个文件而不是多线程写入一个文件?

首先我尝试并发写同一个文件,然后报错了,因为文件是不能并发写的,多线程写入会导致文件烂掉然后再也打不开

然后我想到了我们多线程写不同的文件,然后通过python脚本去合并多个sheet页和多个xsml文件

有个小问题就是xsml文件本身的问题:一个sheet页最多只能写入,所以文件本身就会有限制,这就是为什么要写入多个文件和多个sheet页最终合并文件和sheet页


测试类代码

package com.example.kiratest.test.Excel;import com.alibaba.excel.EasyExcel;
import com.alibaba.excel.ExcelWriter;
import com.alibaba.excel.write.metadata.WriteSheet;
import com.example.kiratest.EasyExcel.Mapper.ExcelMapper;
import com.example.kiratest.EasyExcel.pojo.Excel;
import com.github.pagehelper.PageHelper;
import jakarta.annotation.Resource;
import lombok.extern.slf4j.Slf4j;
import org.junit.jupiter.api.Test;
import org.springframework.boot.test.context.SpringBootTest;import java.util.List;
import java.util.Map;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.ThreadPoolExecutor;
//并发写同一个文件
@SpringBootTest
@Slf4j
public class MutiExcelTest {@Resourceprivate ExcelMapper excelMapper;@ResourceMap<String, ThreadPoolExecutor> ThreadPoolMap;@Testpublic void getData() throws InterruptedException {ThreadPoolExecutor easyExcelThreadPool = ThreadPoolMap.get("EasyExcelThreadPool");//拿到线程池int pageSize = 100000;//10w为一批Integer total = excelMapper.countTotal();//统计数据总数log.info("总数:{}",total);//batchSize<3,用一个线程,6就是2个线程,9就是3个线程int batchSize = (int) Math.ceil((double) total / pageSize);//一共要执行的批次log.info("batchSize:{}",batchSize);int everythreadSize = batchSize / 3;//一共开三个线程,每个线程应该负责多少批次int threadCount = 1; // 主线程if (batchSize > 3 && batchSize < 6) threadCount += 1;else if (batchSize > 6) threadCount += 2;CountDownLatch countDownLatch = new CountDownLatch(threadCount);//开始EasyExcel写入String filePath = "C:\\Users\\ziJian.zheng\\IdeaProjects\\Kira-Test\\src\\main\\resources\\templates\\test1.xlsx";//用来写入的ExcelWriterExcelWriter writer = EasyExcel.write(filePath).build();//
//
////开启异步线程if (batchSize > 3 ) {easyExcelThreadPool.execute(() -> {try {//用来写入的ExcelWriterExcelWriter writer1 = EasyExcel.write(filePath).build();int first = everythreadSize + 1;//作为sheet页标识,也就是批次标识Integer lastId = null;//多Sheet写入for (int i = 0; i < everythreadSize; i++) {WriteSheet sheet = EasyExcel.writerSheet("批次" + first++).build();if (i == 0) {//也就是我们的第一次写入PageHelper.startPage(everythreadSize+1,pageSize);//第一次普通的分页查询,后面要知道id,使用书签法来优化深度分页问题List<Excel> excels = excelMapper.selectAllOrderById();if (excels.size() > batchSize)lastId = excels.get(excels.size() - 1).getId();log.info("LastId:{}",lastId);writer1.write(excels, sheet);} else { //我们的书签法优化List<Excel> excels = excelMapper.deepPaginationSelect(lastId, pageSize);lastId = excels.get(excels.size() - 1).getId();log.info("LastId:{}",lastId);writer1.write(excels, sheet);}}writer1.finish();} finally {countDownLatch.countDown();}});}if (batchSize > 6) {easyExcelThreadPool.execute(() -> {try {//用来写入的ExcelWriterExcelWriter writer2 = EasyExcel.write(filePath).build();int first = 2*everythreadSize + 1;//作为sheet页标识,也就是批次标识Integer lastId = null;//多Sheet写入for (int i = 0; i < everythreadSize; i++) {WriteSheet sheet = EasyExcel.writerSheet("批次" + first++).build();if (i == 0) {//也就是我们的第一次写入PageHelper.startPage(everythreadSize*2+1,pageSize);//第一次普通的分页查询,后面要知道id,使用书签法来优化深度分页问题List<Excel> excels = excelMapper.selectAllOrderById();if (excels.size() > batchSize)lastId = excels.get(excels.size() - 1).getId();log.info("LastId:{}",lastId);writer2.write(excels, sheet);} else { //我们的书签法优化List<Excel> excels = excelMapper.deepPaginationSelect(lastId, pageSize);lastId = excels.get(excels.size() - 1).getId();log.info("LastId:{}",lastId);writer2.write(excels, sheet);}}writer2.finish();} finally {countDownLatch.countDown();}});}//主线程执行try {int first = 0;//作为sheet页标识,也就是批次标识Integer lastId = null;//多Sheet写入for (int i = 0; i < everythreadSize; i++) {WriteSheet sheet = EasyExcel.writerSheet("批次" + first++).build();if (i == 0) {//也就是我们的第一次写入PageHelper.startPage(1, pageSize);//第一次普通的分页查询,后面要知道id,使用书签法来优化深度分页问题List<Excel> excels = excelMapper.selectAllOrderById();if (excels.size() > batchSize)lastId = excels.get(excels.size() - 1).getId();log.info("LastId:{}",lastId);writer.write(excels, sheet);} else { //我们的书签法优化List<Excel> excels = excelMapper.deepPaginationSelect(lastId, pageSize);lastId = excels.get(excels.size() - 1).getId();log.info("LastId:{}",lastId);writer.write(excels, sheet);}}}finally {writer.finish();countDownLatch.countDown();}countDownLatch.await();log.info("导出结束");}@Testvoid test(){List<Excel> excels = excelMapper.deepPaginationSelect(100, 1000);System.out.println(excels);}}

Mapper

package com.example.kiratest.EasyExcel.Mapper;import com.example.kiratest.EasyExcel.pojo.Excel;
import org.apache.ibatis.annotations.Mapper;
import org.apache.ibatis.annotations.Select;import java.util.List;@Mapper
public interface ExcelMapper {@Select("select * from excel order by id")List<Excel> selectAllOrderById();  //查询数据根据id排序,如果这个要分页的话我们就是用我们的PageHelper@Select("select count(*) from excel")Integer countTotal();@Select("select * from excel where id >#{lastMaxId} order by id limit #{batchsize} ")List<Excel> deepPaginationSelect(Integer lastMaxId,Integer batchsize); //深度分页通过书签法解决}

POJO类

package com.example.kiratest.EasyExcel.pojo;import com.alibaba.excel.annotation.ExcelIgnore;
import com.alibaba.excel.annotation.ExcelProperty;
import com.alibaba.excel.annotation.write.style.ColumnWidth;
import com.fasterxml.jackson.annotation.JsonFormat;
import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;import java.util.Date;@Data
@AllArgsConstructor
@NoArgsConstructor
@ColumnWidth(20)
public class Excel {@ExcelIgnoreprivate Integer id;@ExcelProperty(value = "用户姓名",index = 0)private String name;@ExcelProperty(value = "用户Id",index = 1)private String uesrId;@ExcelProperty(value = "居住地址",index = 2)private String location;@JsonFormat(pattern = "yyyy-MM-dd HH:mm:ss",timezone = "GMT+8")private Date createTime;
}
http://www.dtcms.com/wzjs/488266.html

相关文章:

  • 有哪些外国网站做精油的西安seo顾问公司
  • 一个网站做数据分析要多少钱软文营销文章案例
  • 网站模板源代码商丘seo外包
  • wordpress多站点site id广告公司接单软件
  • 山西做网站的公司哪个好夜夜草
  • 盐城做网站的公司长沙疫情最新数据消息
  • 网站建设和网站推广seo整站优化吧
  • 外贸seo网站制作百度账号查询
  • 医院网站优化深圳网页设计
  • 做爰免费网站北京seo
  • 定制系统软件开发网站推广优化排名seo
  • 怎样把网站推广出去轻松seo优化排名 快排
  • 网站专业建设公司seo优缺点
  • 梅州做网站多少钱推广计划方案模板
  • 微信营销ppt嘉兴seo外包公司费用
  • 做外墙资料的网站宁波seo托管公司
  • 怎么把html模板导入wordpress上海关键词排名优化公司
  • 网站开发网页超链接路径企业培训机构有哪些
  • 重庆 网站 建设 公司软文营销模板
  • 开发安卓应用seo培训班 有用吗
  • wordpress无法连接数据库网站优化推广的方法
  • 房产经纪人如何做网站吸客北京seo做排名
  • 新闻列表做的最好的网站如何在百度发布信息推广
  • 策划书格式模板seo推广费用
  • 做陶瓷公司网站百度经验
  • 国外做建筑平面图的网站优秀网站设计赏析
  • 织梦网站模板免费下载自媒体平台
  • 燕莎做网站如何创建自己的个人网站
  • web前端只做网站么成都seo优化排名公司
  • 网站程序源码杭州优化公司在线留言