当前位置: 首页 > wzjs >正文

电子商务网站建设方案案例网站制作公司怎样帮客户做优化

电子商务网站建设方案案例,网站制作公司怎样帮客户做优化,深圳做网站-龙华信科,乐清网站建设摘要 本文将分享一款基于Python的Excel数据净化工具,用于自动清除给定的Excel文档中指定工作表中的不可见字符、批注、单元格样式等冗余数据。脚本支持进度可视化展示,保留核心数据处理逻辑的同时确保文件格式规整,特别适用于需要规范数据格…

摘要

本文将分享一款基于Python的Excel数据净化工具,用于自动清除给定的Excel文档中指定工作表中的不可见字符、批注、单元格样式等冗余数据。脚本支持进度可视化展示,保留核心数据处理逻辑的同时确保文件格式规整,特别适用于需要规范数据格式的企业级应用场景。


架构流程图

异常处理
可视化组件
核心处理模块
存在
不存在
循环处理
完成所有行
输出错误信息
更新进度条
清理条件格式
清除不可见字符
移除批注
重置字体样式
清除填充颜色
用户输入
输入参数
加载Excel文件
工作表存在性检查
初始化清理
逐行处理单元格
保存新文件

工具脚本源码

import openpyxl
from openpyxl.styles import NamedStyle, Font, Border
from openpyxl.formatting import Rule
import re
from tqdm import tqdm  # 新增进度条库
from openpyxl.styles import PatternFilldef clean_invisible_chars(text):"""清除字符串中的不可见字符"""if not isinstance(text, str):return text# 清除控制字符(ASCII 0-31,除了\t\n\r)return re.sub(r'[\x00-\x08\x0b\x0c\x0e-\x1f\x7f]', '', text)def clear_all_and_save(input_file, output_file, sheet_name):"""清除工作表中的:1. 不可见字符2. 批注3. 单元格样式"""# 已清理的列表cleared_set = set()# 加载工作簿wb = openpyxl.load_workbook(input_file)# 创建无样式对象no_style = NamedStyle(name="Normal")# 创建无填充对象no_fill = PatternFill(fill_type=None)# 检查工作表是否存在if sheet_name not in wb.sheetnames:print(f"错误: 工作表 '{sheet_name}' 不存在。")print(f"可用工作表列表: {', '.join(wb.sheetnames)}")return# 获取工作表ws = wb[sheet_name]# 获取总行数用于进度条total_rows = ws.max_rowfirst_init = True# 使用tqdm显示进度条for row in tqdm(ws.iter_rows(), total=total_rows, desc="处理进度"):if first_init == True:print(f"初始化完成,开始清理数据...")# 彻底清除所有条件格式和样式ws.conditional_formatting = []cleared_set.add('条件格式填充色')# cleared_set.add('单元格默认样式')print(f"✔ 已彻底清理 工作表:{sheet_name} 的所有样式设置, 开始单元格处理...")first_init = Falsefor cell in row:# 彻底清除单元格所有样式cell.fill = PatternFill(fill_type=None)cell.font = Font(name='Calibri', size=11, bold=False, italic=False)cell.border = Border()cell.number_format = 'General'# 清除不可见字符if cell.value and isinstance(cell.value, str):cell.value = clean_invisible_chars(cell.value)cleared_set.add('不可见字符')# 清除批注if cell.comment:cell.comment = Nonecleared_set.add('批注')# 清除样式cell.style = no_stylecleared_set.add('单元格样式')# 清除单元格填充颜色if cell.fill:cell.fill = no_fillcleared_set.add('单元格填充色')# 保存工作簿到新的文件wb.save(output_file)# cleared_text = ", ".join(cleared_set)cleared_text = "\n".join(f"  ✔ 清除-{item}" for item in cleared_set)# print(f"已清理[{cleared_text}],并保存到 {output_file}")print("已完成:\n"+cleared_text+f"\n并保存到 {output_file}")# 使用示例
input_excel_file = r'测试-脱敏结果.xlsx'  # 输入Excel文件路径
output_excel_file = r'清除样式_测试-脱敏结果.xlsx'  # 输出Excel文件路径
sheet_to_clean = 'PB' # 'Sheet1'  # 要清理的工作表名称print(f"初始化中...")
print(f"输入文件: {input_excel_file}")
print(f"输出文件: {output_excel_file}")
print(f"目标工作表: {sheet_to_clean}")
try:clear_all_and_save(input_excel_file, output_excel_file, sheet_to_clean)
except Exception as e:print(f"处理过程中发生错误: {str(e)}")

功能特性说明

1. 三重数据净化

  • 隐形字符清除:正则表达式过滤ASCII 0-31控制字符
  • 格式重置:统一字体、边框、填充样式为默认值
  • 元数据清理:移除单元格批注及条件格式

2. 可视化进度提示

采用tqdm库实现:

  • 实时处理进度条
  • 预估剩余时间
  • 已完成项目统计

3. 安全防护机制

  • 工作表存在性校验
  • 异常捕获与友好提示
  • 输出文件独立保存

典型应用场景

  1. 数据迁移前的格式标准化
  2. 第三方数据接入清洗
  3. 报表自动化生成预处理
  4. 敏感信息脱敏后处理
http://www.dtcms.com/wzjs/794225.html

相关文章:

  • 邯郸公司做网站渭南建设工程招标投标网站
  • 论坛网站建设费用站长查询工具
  • 抚顺网站建设推荐嘉兴网站制作策划
  • 一个外国人做汉字网站百度网站服务器
  • 台州企业网站0基础做电商从何下手
  • 注册网站域名多少钱一年江山做网站
  • 即墨网站优化网站建设技术参数
  • 某服装企业网站建设方案下百度安装
  • c 网站购物车怎么做专业网站设计公司有哪些
  • 重庆的网站设计公司价格网站后端开发流程
  • 59网站一起做网店广州郑州百度推广seo
  • 网站开发设计工程师工作前景国际网站建设经验
  • php网站后台进不去外贸平台有哪些分别对应哪个市场
  • 扶贫办网站建设亚马逊品牌网站建设
  • 找人做网站排名百度不让访问危险网站怎么办
  • 网站开发用px好还是em好网站开发项目建设规范
  • 公司网站流程广西建设职业技术学院官方网站
  • 大连做网站微信小程序代理
  • 只能在线观看的电影网站咋么做wordpress外贸建站怎么加左侧边栏
  • 百度小程序开发平台一个网站如何做seo优化
  • 网站工程专业是什么北京高端网站建设案例
  • 网站建设实录做网站需要学那些
  • 苏州网站建设网站开发深圳市住房和城乡建设厅网站首页
  • 网站自动登录怎么做建立网站如何
  • 国内专门做情侣的网站商城新建站点的步骤
  • 做新的网站卡盟网站制作教程
  • 成都那家网站做的好私域平台运营分为几个步骤
  • 浦口区建设网站成都网站开发公司排名
  • 如何做网站软件搭建服务器做网站
  • 外销网站百度竞价代运营公司