当前位置: 首页 > news >正文

遍历所有文件夹,并把文件里所有的csv合并为一个dataframe

import os
import pandas as pd

def load_and_combine_csv(root_dir):
    # 初始化一个空的列表来存储所有的DataFrame
    df_list = []

    # 遍历根目录下的所有文件夹及子文件夹
    for subdir, _, files in os.walk(root_dir):
        for file in files:
            if file.endswith(".csv"):
                # 构造文件的完整路径
                file_path = os.path.join(subdir, file)
                
                # 读取CSV文件为DataFrame
                df = pd.read_csv(file_path)
                
                # 将DataFrame添加到列表中
                df_list.append(df)

    # 将所有的DataFrame合并为一个
    combined_df = pd.concat(df_list, ignore_index=True)
    
    return combined_df

# 使用函数遍历并合并CSV文件
root_directory = 'path_to_your_directory'  # 根目录路径
combined_data = load_and_combine_csv(root_directory)

# 查看合并后的数据
print(combined_data.head())

相关文章:

  • ES6基础----Map的使用
  • vue3.5更新内容
  • 爬虫常用模板
  • css画个熊猫
  • C语言:刷题笔记
  • MyCat
  • ant vue design日期组件date-picker自定义快捷选择日期封装
  • OpenXR Monado创建Swapchain和生成纹理
  • Verilog基础,原码,反码与补码的概念
  • 透明加密为什么是最佳选择,10款透明加密软件推荐
  • CGLIB 是什么
  • Linux驱动(四):Linux2.6字符设备驱动及GPIO子系统
  • [数据集][目标检测]鲜花检测数据集VOC+YOLO格式25215张106类别
  • 【2024-2025源码+文档+调试讲解】微信小程序的城市公交查询系统
  • 三级_网络技术_59_应用题
  • 机器学习:svm算法原理的优缺点和适应场景
  • 【Python】数据分析分类图可视化
  • C++入门day3-面向对象编程(中)
  • c++ unordered_set的用法
  • 登录-异步请求用户数据无法保存-bug
  • “人工智能是年轻的事业,也是年轻人的事业”,沪上高校师生畅谈感想
  • 神十九飞船已撤离空间站,计划于今日中午返回东风着陆场
  • 今年一季度全国城镇新增就业308万人,就业形势保持总体稳定
  • 【社论】优化限购限行,激发汽车消费潜能
  • 外交部:欢迎外国朋友“五一”来中国
  • 清华姚班,正走出一支军团