当前位置: 首页 > news >正文

如何将excel数据快速导入数据库

最近老是收到一些手工数据,并且需要关联分析,就想到如何快速将数据导入数据库后关联查询输出结果,下面是一段将excel数据写入mysql的脚本,欢迎大家提出优化意见相互学习。

import os
import pandas as pd
import pymysql
import numpy as np
from dotenv import load_dotenv, find_dotenv

# ✅ 加载 config.env 文件
env_path = find_dotenv(filename="config.env")
if not env_path:
    raise FileNotFoundError("❌ 未找到 config.env 文件,请确保它与脚本在同一目录下")
load_dotenv(env_path)

# ✅ 获取环境变量
excel_path = os.getenv("EXCEL_PATH")
db_host = os.getenv("DB_HOST")
db_user = os.getenv("DB_USER")
db_password = os.getenv("DB_PASSWORD")
db_name = os.getenv("DB_NAME")
table_name = os.getenv("DB_TABLE")

# ✅ 打印调试信息(可注释)
print("📄 Excel 路径:", excel_path)
print("📦 数据库:", db_name, "| 表名:", table_name)

# ✅ 检查路径是否存在
if not excel_path or not os.path.exists(excel_path):
    raise ValueError("❌ Excel 路径无效,请检查 EXCEL_PATH 配置和文件是否存在")

# ✅ 读取 Excel 文件
df = pd.read_excel(excel_path)
print(f"✅ 成功读取 Excel,共 {len(df)} 行")

# ✅ 替换 NaN 和 NaT 为 None,确保兼容 pymysql
df = df.replace({np.nan: None, pd.NaT: None})
# 或者:df = df.applymap(lambda x: None if pd.isna(x) else x)

# ✅ 连接 MySQL 数据库
conn = pymysql.connect(
    host=db_host,
    user=db_user,
    password=db_password,
    database=db_name,
    charset='utf8mb4'
)
cursor = conn.cursor()

# ✅ 构造 INSERT SQL
cols = ",".join([f"`{col}`" for col in df.columns])
placeholders = ",".join(["%s"] * len(df.columns))
insert_sql = f"INSERT INTO `{table_name}` ({cols}) VALUES ({placeholders})"

# ✅ 插入数据
try:
    cursor.executemany(insert_sql, df.values.tolist())
    conn.commit()
    print(f"✅ 成功插入 {cursor.rowcount} 行数据到表 `{table_name}`")
except Exception as e:
    conn.rollback()
    print("❌ 插入数据失败:", str(e))

    # 可选:定位第几行出错(调试用)
    for i, row in enumerate(df.values.tolist()):
        try:
            cursor.execute(insert_sql, row)
        except Exception as err:
            print(f"⚠️ 第 {i} 行插入失败:{err}")
            print("🧪 数据内容:", row)
            break
finally:
    cursor.close()
    conn.close()
    print("🔚 数据库连接已关闭")

相关文章:

  • 【时频谱分析】快速谱峭度
  • 每日算法-250413
  • deskflow使用教程:一个可以让两台电脑鼠标键盘截图剪贴板共同使用的开源项目
  • 【开发工具】科研开发中的主流AI工具整理及如何使用GPT润色英文论文
  • 【苹果cms 1】本地影视资源站搭建
  • [文献阅读] chinese-roberta Pre-Training With Whole Word Masking for Chinese BERT
  • 真实企业级K8S故障案例:ETCD集群断电恢复与数据保障实践
  • QML ListView 与 C++ 模型交互
  • 微信小程序实战案例 - 餐馆点餐系统 阶段 0 - 环境就绪
  • 玩转Docker | 使用Docker部署MicroBin粘贴板
  • Java新手村第二站:泛型、集合与IO流初探
  • k8s的配置文件总结
  • Go学习路线指南
  • springboot框架集成websocket依赖实现物联网设备、前端网页实时通信!
  • MySQL——MVCC(多版本并发控制)
  • 免费在线文档工具,在线PDF添加空白页,免费在任意位置插入空白页,多样化的文件处理
  • 【AI论文】MM-IFEngine:迈向多模态指令遵循
  • Magnet Pro Macbook窗口分屏管理软件【提高效率工具】
  • 从零训练LLM-1.训练BPE
  • 猫咪如厕检测与分类识别系统系列【五】信息存储数据库改进+添加猫咪页面制作+猫咪躯体匹配算法架构更新
  • 浙江一民企拍地后遭政府两次违约,“民告官”三年又提起民事诉讼
  • 国家主席习近平同普京总统举行小范围会谈
  • 上海优化营商环境再攻坚,企业和机构有哪些切实感受?
  • A股26家游戏企业去年营收近1900亿元:过半净利下滑,出海成为主流选择
  • 江淮、极氪、奇瑞,排着队造“劳斯莱斯”
  • 哥伦比亚总统称将在访华期间签署“一带一路”倡议意向书,外交部回应