当前位置: 首页 > news >正文

网站管理平台扩展插件黄页污水

网站管理平台扩展插件,黄页污水,哪里网站备案,网络服务营销在Python中,可以使用pandas库结合glob模块来遍历读取多个Excel文件,并将它们竖向拼接为一个DataFrame对象。以下是完整的实现方法: 文章目录方法1:使用glob匹配文件 pd.concat()方法2:使用列表推导式(更简…

在Python中,可以使用pandas库结合glob模块来遍历读取多个Excel文件,并将它们竖向拼接为一个DataFrame对象。以下是完整的实现方法:

文章目录

  • 方法1:使用`glob`匹配文件 + `pd.concat()`
  • 方法2:使用列表推导式(更简洁)
  • 方法3:处理多个Sheet的情况
  • 高级用法:添加文件来源列
  • 注意事项
  • 完整示例(推荐)

方法1:使用glob匹配文件 + pd.concat()

import pandas as pd
import glob# 1. 获取所有Excel文件路径(支持.xlsx和.xls)
excel_files = glob.glob('*.xlsx') + glob.glob('*.xls')  # 当前目录下所有Excel文件
# 或者指定路径:glob.glob('/path/to/files/*.xlsx')# 2. 读取并拼接所有Excel文件
dfs = []
for file in excel_files:df = pd.read_excel(file)  # 可以添加参数如sheet_name='Sheet1'dfs.append(df)# 3. 竖向拼接所有DataFrame
result = pd.concat(dfs, ignore_index=True)# 4. 查看结果
print(result)# 保存为一个xlsx
result.to_excel('汇总.xlsx')

方法2:使用列表推导式(更简洁)

import pandas as pd
import glob# 读取并拼接所有Excel文件
result = pd.concat([pd.read_excel(f) for f in glob.glob('*.xlsx') + glob.glob('*.xls')
], ignore_index=True)print(result)
# 保存为一个xlsx
result.to_excel('汇总.xlsx')

方法3:处理多个Sheet的情况

如果需要读取每个Excel文件的多个Sheet:

import pandas as pd
import globdfs = []
for file in glob.glob('*.xlsx'):# 获取所有Sheet名称sheets = pd.ExcelFile(file).sheet_namesfor sheet in sheets:df = pd.read_excel(file, sheet_name=sheet)dfs.append(df)result = pd.concat(dfs, ignore_index=True)
# 保存为一个xlsx
result.to_excel('汇总.xlsx')

高级用法:添加文件来源列

如果需要知道每行数据来自哪个文件:

dfs = []
for file in glob.glob('*.xlsx'):df = pd.read_excel(file)df['source_file'] = file  # 添加来源文件列dfs.append(df)result = pd.concat(dfs, ignore_index=True)
# 保存为一个xlsx
result.to_excel('汇总.xlsx')

注意事项

  1. 内存管理:如果文件很大或很多,建议分批处理或使用chunksize参数
  2. 列一致性:确保所有Excel文件的列结构相同,否则拼接后会出现很多NaN值
  3. 性能优化:对于大量文件,可以使用tqdm显示进度条:
    from tqdm import tqdm
    dfs = []
    for file in tqdm(glob.glob('*.xlsx')):dfs.append(pd.read_excel(file))
    result = pd.concat(dfs, ignore_index=True)# 保存为一个xlsxresult.to_excel('汇总.xlsx')
    
  4. 异常处理:添加try-except块处理损坏的文件
    dfs = []
    for file in glob.glob('*.xlsx'):try:dfs.append(pd.read_excel(file))except Exception as e:print(f"Error reading {file}: {str(e)}")
    

完整示例(推荐)

import pandas as pd
import globdef read_and_concat_excels(pattern='*.xlsx', sheet_name=0, add_source=False):"""读取并拼接多个Excel文件参数:pattern: 文件匹配模式 (如 'data/*.xlsx')sheet_name: 要读取的Sheet名称或索引add_source: 是否添加来源文件列返回:拼接后的DataFrame"""dfs = []for file in glob.glob(pattern):try:df = pd.read_excel(file, sheet_name=sheet_name)if add_source:df['source_file'] = filedfs.append(df)except Exception as e:print(f"跳过文件 {file}: {str(e)}")if not dfs:raise ValueError("没有找到可读取的Excel文件")return pd.concat(dfs, ignore_index=True)# 使用示例
combined_df = read_and_concat_excels(pattern='input_files/*.xlsx', add_source=True)
combined_df.to_excel('汇总.xlsx', index=False)

这种方法既健壮又灵活,可以处理大多数Excel文件拼接的场景。

http://www.dtcms.com/a/500518.html

相关文章:

  • h5网站怎么做api对接建设小说网站费用
  • 有小间隔值的switch-case语句,编译器使用了两级跳转表(two-level jump table)优化。
  • flash手机网站制作商家小程序怎么制作
  • 建设部指定招标网站phpcms做网站好吗
  • 桶装水网站建设江苏SEO网站建设
  • seo数据优化教程seo 网站title
  • (论文速读)文本引导的可探索图像超分辨率
  • 网站开发十大公司wordpress如何修改后台登录地址
  • 网站创建做网站分什么软件
  • 好的做淘宝详情页的网站有哪些分销网络建设
  • AI协同编程架构师岗位的诞生
  • 网站首页尺寸深圳龙华租房
  • wordpress网站好优化吗做网站难度大吗
  • 谷歌 Gemini 2.5 Pro 免费王炸 AI 战场格局剧变
  • 数据结构之线性表——循环链表
  • 百度竞价做网站建设安阳百度贴吧
  • 周学习记录分享
  • SQL Server从入门到项目实践(超值版)读书笔记 28
  • 2020年08月份04741计算机网络原理真题及答案
  • 第22讲:动态内存管理
  • 将 XMind 测试用例转换为 CSV 文件导入测试管理平台
  • 网站开发用什么语言写免费网站域名注册个人
  • ORB_SLAM2原理及代码解析:Viewer 线程——Viewer::Run()
  • FullCalendar:现代Web应用中的专业日历解决方案
  • 商城网站设计图哈尔滨网站建设贴吧
  • Windows安装MongoDB保姆级教程(图文详解)
  • 生活中花钱请人做网站昆明公司网站制作
  • 东莞专业网站推广平台网站功能价格表
  • 博客网站的建设流程邯郸网站建设网页设计网络推广
  • wordpress 发布站重庆响应式网站建设