【数模技巧】使用python将.xlsx文件转换为CSV文件
若在数模之中使用cursor,我们常常需要读取xlsx文件,但是在cursor之中通常不允许xlsx的直接读取,只能转换为csv文件读取
于是我们先使用pandas转换格式为pd,然后再导出为csv文件
import pandas as pd
import os
basepath = os.path.dirname(os.path.abspath(__file__))
# 自行设置路径
excel_path = os.path.join(basepath, "C题", "附件.xlsx")
xls = pd.ExcelFile(excel_path)
print("工作表:", xls.sheet_names)
# 2) 读取整本工作簿:返回 {sheet_name: DataFrame}
all_sheets = pd.read_excel(excel_path,sheet_name=None, # None 表示读取所有表engine="openpyxl",# keep_default_na=False, # 空单元不变成NaN,留空# dtype=str, # 全部按文本读,避免类型混杂
)
这样就存在了all_sheets文件当中,但是llm仍然无法读取,只能转为csv文件
for name, df in all_sheets.items():df.fillna("").to_csv(f"{name}.csv", index=False, encoding="utf-8-sig")
这样就可自动转换了