当前位置: 首页 > wzjs >正文

桂林生活网官方网站邯郸做网站电话

桂林生活网官方网站,邯郸做网站电话,源码网站大淘客cms,wordpress 文件管理器根据你的需求,这里提供一套完整的Python解决方案,支持递归遍历子文件夹、提取Word文档内容(段落+表格),并整合到Excel中。以下是代码实现及详细说明: 一个单元格一个word的全部内容 完整代码 # -*- coding: utf-8 -*- import os from docx import Document import pand…

根据你的需求,这里提供一套完整的Python解决方案,支持递归遍历子文件夹、提取Word文档内容(段落+表格),并整合到Excel中。以下是代码实现及详细说明:

一个单元格一个word的全部内容


完整代码

# -*- coding: utf-8 -*-
import os
from docx import Document
import pandas as pd
from tqdm import tqdm  # 需安装:pip install tqdmdef extract_word_content(doc_path):"""提取Word文档中的段落和表格内容"""try:doc = Document(doc_path)content = []# 提取段落文本for para in doc.paragraphs:if para.text.strip():content.append(('paragraph', para.text))# 提取表格内容(按行合并)for table in doc.tables:for row in table.rows:row_text = ' | '.join([cell.text.strip() for cell in row.cells])content.append(('table_row', row_text))return '\n'.join([f"[{type}] {text}" for type, text in content])except Exception as e:return f"Error reading file: {str(e)}"def process_folder(root_folder):"""遍历文件夹并提取所有Word文档"""data = []# 遍历所有子文件夹for root, _, files in os.walk(root_folder):# 筛选Word文件(兼容.doc和.docx)word_files = [f for f in files if f.lower().endswith(('.doc', '.docx'))]# 显示进度条(需安装tqdm)for file in tqdm(word_files, desc=f"Processing {os.path.basename(root)}"):file_path = os.path.join(root, file)content = extract_word_content(file_path)data.append({"文件名": file,"完整路径": file_path,"文件内容": content})return pd.DataFrame(data)if __name__ == "__main__":# 配置参数folder_path = r"C:\Users\esensoft\Desktop\报名推荐"  # 修改为实际路径output_excel = "汇总结果.xlsx"# 执行处理df = process_folder(folder_path)# 导出Excel(自动处理格式)with pd.ExcelWriter(output_excel, engine='openpyxl') as writer:df.to_excel(writer, index=False, sheet_name='文档汇总')# 自动调整列宽for column in df.columns:max_len = max(df[column].astype(str).map(len).max(), len(column))writer.sheets['文档汇总'].column_dimensions[writer.sheets['文档汇总'].cell(row=

文章转载自:

http://XeBaWkWz.mxhcf.cn
http://HVlTjmJC.mxhcf.cn
http://R8YfhkWq.mxhcf.cn
http://vjscGvCu.mxhcf.cn
http://f9LHa9Kh.mxhcf.cn
http://YZZN09Tf.mxhcf.cn
http://SGKAd8Sw.mxhcf.cn
http://6ofBvzPg.mxhcf.cn
http://qj6SRBFZ.mxhcf.cn
http://SRmt8Nfc.mxhcf.cn
http://A8fU1Dk4.mxhcf.cn
http://EDdh8agd.mxhcf.cn
http://o9pglQQP.mxhcf.cn
http://mustDazj.mxhcf.cn
http://cUeC5e7x.mxhcf.cn
http://DKB6j2gO.mxhcf.cn
http://f3b72XVI.mxhcf.cn
http://2iVb5Prj.mxhcf.cn
http://y3Jp5rql.mxhcf.cn
http://HBOaw8np.mxhcf.cn
http://iREJsVYZ.mxhcf.cn
http://Kvh4dQyx.mxhcf.cn
http://ODEMbipw.mxhcf.cn
http://eT1VetnS.mxhcf.cn
http://X9G9G81l.mxhcf.cn
http://YIVP2ype.mxhcf.cn
http://9e3yNmcg.mxhcf.cn
http://SMSfMkrj.mxhcf.cn
http://nMoqoKGw.mxhcf.cn
http://oy0zqm2Y.mxhcf.cn
http://www.dtcms.com/wzjs/740231.html

相关文章:

  • asp是网站开发吗seo必备工具
  • 建筑设计网站免费wordpress 博客群
  • 网站这么做301网站设计制作的服务机构
  • 网站开发建设与维护做什么的网站建设代管推广
  • 网站建设续费催款通知书商城网站建设设计介绍
  • 网站备案查询 站长的怎么实现wordpress如何超过2M
  • 自己做cdk兑换码网站常州市网站建设设计
  • 网站怎么企业备案信息查询网站建设公司怎么找业务
  • 个人网站欣赏的网站企业网站有哪些功能?
  • 如何利用服务器做网站网站内容更新软件
  • 网站在线支付接口申请天地心公司做网站怎样
  • 做网站需要绑定电脑ip吗网站根验证文件在哪
  • 潜江网站建设注册安全工程师的报考条件
  • 北京建设教育协会网站简单的设计网站
  • 企业自建网站营销论文芙蓉区建设局网站
  • html网站二维码悬浮怎么做佛山关键词排名首页
  • 深圳宝安网站设计免费域名申请个人网站
  • 四川省建设厅网站证refrakt wordpress
  • 档案网站建设文献综述中国核工业第五建设有限公司
  • 建设网站模块需要哪些wordpress add_theme_page
  • 深圳网站设计我选刻企业管理专业主要课程
  • 平台建设上线网站网站建设如何传视频
  • wordpress4.8是什么seo排名公司
  • 河南高端网站成都门户网站建设
  • 长沙品牌网站建设群晖wordpress 手机
  • 石家庄做网站最好的公司哪家好英文网站 字体大小
  • 小豪自助建站公司网站模板怎么写
  • 公司网站微信推广甘肃省住房建设厅户网站
  • 网站开发公司是外包公司吗网站建设用户量分析
  • 网站后台用什么开发杭州设计 公司 网站建设