当前位置: 首页 > news >正文

挑选出行数足够的excel文件

**

遍历文件夹下的所有excel文件,并将数据量超过指定标准的文件拷贝到指定文件夹中

import os.path
import shutil
import pandas as pd


def copy_excel_files(source_folder, target_folder, row_threshold):
    if not os.path.exists(target_folder):
         os.makedirs(target_folder)

    for filename in os.listdir(source_folder):
        if filename.endswith(
                ('.xlsx', '.xls')
        ):
            file_path = os.path.join(source_folder, filename)
            try:
                df = pd.read_excel(file_path)
                if len(df) > row_threshold:
                    target_path = os.path.join(target_folder, filename)
                    shutil.copy2(file_path, target_path)
                    print(f"已复制文件{filename}")
            except Exception as e:
                print(f"处理文件{filename}时出错:{e}")

if __name__ == "__main__":
    # 源文件夹路径
    source_folder = '自定义路径1'
    # 目标文件夹路径
    target_folder = '自定义路径2'
    # 行数阈值,可根据需要修改
    row_threshold = 50

    copy_excel_files(source_folder, target_folder, row_threshold)

相关文章:

  • 前端:最简单封装nmp插件(组件)过程。
  • 什么是Ajax
  • 深度解析 DeepSeek R1 与 Grok-3:智能领域的实力较量
  • 【强化学习的数学原理】第10课-Actor-Critic方法-笔记
  • IP关联:定义、影响及避免策略‌
  • new 一个构造函数的过程以及手写 new
  • 【为什么使用`new DOMParser`可以保持SVG命名空间】
  • Deepseek 怼CHATGPT实况
  • 第二章 分词和嵌入
  • Stm32中SysTick 定时器的使用
  • 挪车小程序挪车二维码php+uniapp
  • 深度优先探索
  • Java的switch
  • Nacos 2.5.0 内置数据库集群部署
  • 如何将Docker运行的镜像写入数据后导出为新的镜像
  • 【小白学HTML5】盒模型(一文讲清margin、padding)_第三讲
  • Stm32定时器输出PWM
  • Fast R-CNN
  • 【小白学HTML5】盒模型_第一讲
  • 前端框架虚拟DOM的产生
  • 人民日报评外卖平台被约谈:合法规范经营,公平有序竞争
  • 美国4月CPI同比上涨2.3%低于预期,为2021年2月来最小涨幅
  • 习近平在中拉论坛第四届部长级会议开幕式的主旨讲话(全文)
  • 飙升至熔断,巴基斯坦股市两大股指收盘涨逾9%
  • 李公明 | 一周画记:印巴交火会否升级为第四次印巴战争?
  • 深一度|在亚马尔的天才面前,姆巴佩戴上“帽子”又如何