当前位置: 首页 > news >正文

国家药品监督管理局医疗器械唯一标识管理信息批量导入mysql工具

安装与配置

安装Python依赖包

pip install -r requirements.txt

配置数据库连接参数 编辑config.py文件设置数据库连接信息,或通过环境变量配置:

export DB_HOST=localhost
export DB_PORT=3306
export DB_USER=root
export DB_PASSWORD=yourpassword
export DB_NAME=udi_database

创建目标数据库

CREATE DATABASE udi_database CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

数据导入流程

修复XML文件格式问题

python fix_xml_files.py

执行数据导入

python run_import.py

数据库优化

创建查询索引(必需操作)

USE udi_database;
CREATE INDEX idx_devices_device_id ON devices(device_id);
CREATE INDEX idx_packings_device_id ON packings(device_id);
CREATE INDEX idx_contacts_device_id ON contacts(device_id);

验证索引状态

SHOW INDEX FROM devices;

批量导入优化

临时禁用索引加速导入

ALTER TABLE devices DISABLE KEYS;
ALTER TABLE packings DISABLE KEYS;

导入完成后重建索引

ALTER TABLE devices ENABLE KEYS;
ALTER TABLE packings ENABLE KEYS;

性能注意事项

  • UTF-8编码的XML文件才能确保正确解析
  • 单文件超过100MB建议拆分处理
  • 导入期间避免执行其他数据库操作
  • 完成导入后立即建立索引可提升10倍以上查询性能

故障排查

检查日志文件

tail -f import_xml.log

验证数据完整性

SELECT COUNT(*) FROM devices;
SELECT COUNT(DISTINCT device_id) FROM devices;

链接: https://pan.baidu.com/s/1WiQI3MyNs_XHfeoamTFsdg 提取码: h1k1 

http://www.dtcms.com/a/323300.html

相关文章:

  • 算法篇----模拟
  • 企业级高性能web服务器
  • 沿街晾晒识别误检率↓76%:陌讯多模态融合算法实战解析
  • VisionPro常用标定方式
  • 本科毕业论文怎么引用github里面数据集
  • Vue3从入门到精通: 2.2 Vue3组件通信与数据传递深度解析
  • AI热点周报(8.3~8.9):OpenAI重返开源,Anthropic放大招,Claude4.1、GPT5相继发布
  • 心灵笔记:正念冥想
  • imx6ull-驱动开发篇16——信号量与互斥体
  • SpringBoot学习日记 Day6:解锁微服务与高效任务处理
  • .NET程序跨平台ARM电脑上发布的程序格式是,so还是DLL?
  • AWT 基本组件深入浅出:Button/Label/TextField/Checkbox/Choice/List 全面实战与性能优化
  • GPT-4 vs GPT-5 深度分析
  • 逻辑回归详解:原理、应用与实践
  • n沟道增强型mos管
  • 支持 UMD 自定义组件与版本控制:从 Schema 到动态渲染
  • Beelzebub靶机通关教程
  • java 中 @NotBlank 和 @NotNull 的区别
  • 【LLM实战|llamaIndex】llamaIndex介绍和RAG
  • dnSpy:设置断点
  • Docker 容器中运行昇腾(Ascend)AI 环境
  • Vitalik谈以太坊:ETH财库储备策略“有益且有价值”
  • SELinux 入门指南
  • vue+flask大模型写诗诗词推荐与可视化系统
  • 代理人工智能的隐藏威胁
  • 【渲染流水线】[几何阶段]-[图元装配]以UnityURP为例
  • Pandas 分层索引
  • AI 大模型企业级应用落地挑战与解决方案
  • 机器翻译:需要了解的数学基础详解
  • BPMN编辑器技术实现总结AI时代的工作流编辑器