当前位置: 首页 > news >正文

Python 进阶(七):XML 基本操作

目录
    • 1. 概述
    • 2. 写入
    • 3. 解析
      • 3.1 DOM 方式
      • 3.2 SAX 方式
      • 3.3 ElementTree 方式

1. 概述

XML(Extensible Markup Language)中文译为可扩展标记语言,它是一种简单、灵活、易扩展的文本格式,它主要关注数据内容,常用来传送、存储数据。

当通过 XML 来传送数据时,自然会涉及到 XML 的解析工作,通常 Python 可以通过如下三种方式来解析 XML:

  • DOM
    DOM 方式会将整个 XML 读入内存,在内存中解析成一个树,通过对树的操作来操作 XML,该方式占用内存较大,解析速度较慢。

  • SAX
    SAX 方式逐行扫描 XML 文档,边扫描边解析,占用内存较小,速度较快,缺点是不能像 DOM 方式那样长期留驻在内存,数据不是长久的,事件过后,若没保存数据,数据会丢失。

  • ElementTree
    ElementTree 方式几乎兼具了 DOM 方式与 SAX 方式的优点,占用内存较小、速度较快、使用也较为简单。

2. 写入

首先,我们通过 Python 创建一个 XML 文档并向其中写入一些数据,实现代码如下所示:

from xml.etree import ElementTree as et
import xml.dom.minidom as minidom# 创建根节点 
root = et.Element('school')
names = ['张三', '李四']
genders = ['男', '女']
ages = ['20', '18']
# 添加子节点
student1 = et.SubElement(root, 'student')
student2 = et.SubElement(root, 'student')
et.SubElement(student1, 'name').text = names[0]
et.SubElement(student1, 'gender').text = genders[0]
et.SubElement(student1, 'age').text = ages[0]
et.SubElement(student2, 'name').text = names[1]
et.SubElement(student2, 'gender').text = genders[1]
et.SubElement(student2, 'age').text = ages[1]
# 将根目录转化为树行结构
tree = et.ElementTree(root)
rough_str = et.tostring(root, 'utf-8')
# 格式化
reparsed = minidom.parseString(rough_str)
new_str = reparsed.toprettyxml(indent='\t')
f = open('test.xml', 'w', encoding='utf-8')
# 保存
f.write(new_str)
f.close()

看一下效果:

3. 解析

我们分别使用 DOM、SAX、ElementTree 方式解析上面生成的 XML 文件。

3.1 DOM 方式

看一下如何通过 DOM 方式进行解析,实现代码如下所示:

from xml.dom.minidom import parse# 读取文件
dom = parse('test.xml')
# 获取文档元素对象
elem = dom.documentElement
# 获取 student
stus = elem.getElementsByTagName('student')
for stu in stus:# 获取标签中内容name = stu.getElementsByTagName('name')[0].childNodes[0].nodeValuegender = stu.getElementsByTagName('gender')[0].childNodes[0].nodeValueage = stu.getElementsByTagName('age')[0].childNodes[0].nodeValueprint('name:', name, ', gender:', gender, ', age:', age)

执行结果:

name: 张三 , gender: 男 , age: 20
name: 李四 , gender: 女 , age: 18
3.2 SAX 方式

看一下如何通过 SAX 方式进行解析,实现代码如下所示:

import xml.saxclass StudentHandler(xml.sax.ContentHandler):def __init__(self):self.name = ''self.age = ''self.gender = ''# 元素开始调用def startElement(self, tag, attributes):self.CurrentData = tag# 元素结束调用def endElement(self, tag):if self.CurrentData == 'name':print('name:', self.name)elif self.CurrentData == 'gender':print('gender:', self.gender)elif self.CurrentData == 'age':print('age:', self.age)self.CurrentData = ''# 读取字符时调用def characters(self, content):if self.CurrentData == 'name':self.name = contentelif self.CurrentData ==  'gender':self.gender = contentelif self.CurrentData ==  'age':self.age = contentif (__name__ == "__main__"):# 创建 XMLReaderparser = xml.sax.make_parser()# 关闭命名空间parser.setFeature(xml.sax.handler.feature_namespaces, 0)# 重写 ContextHandlerHandler = StudentHandler()parser.setContentHandler(Handler)parser.parse('test.xml')

执行结果:

name: 张三
gender: 男
age: 20
name: 李四
gender: 女
age: 18
3.3 ElementTree 方式

看一下如何通过 ElementTree 方式进行解析,实现代码如下所示:

import xml.etree.ElementTree as ettree = et.parse('test.xml')
# 根节点
root = tree.getroot()
for stu in root:print('name:', stu[0].text, ', gender:', stu[1].text, ', age:', stu[2].text)

执行结果:

name: 张三 , gender: 男 , age: 20
name: 李四 , gender: 女 , age: 18

http://www.dtcms.com/a/289993.html

相关文章:

  • opencv无法读取视频
  • Python100个库分享第38个—lxml(爬虫篇)
  • Navicat 17.3 正式发布 | 现已支持达梦、金仓和 IvorySQL 数据库
  • 图片转 PDF三个免费方法总结
  • C++ - 仿 RabbitMQ 实现消息队列--服务端核心模块实现(二)
  • CoolUtils Total PDF Converter:多功能PDF转换专家
  • STM32之GPS定位模块(GT-U8)
  • 合并pdf工具下载
  • Kotlin 高阶函数初步学习
  • k8s的calico无法启动报错解决
  • 集群技术笔记-HAProxy 与 Keepalived 高可用负载均衡实战
  • 如何使用python网络爬虫批量获取公共资源数据实践技术应用
  • 江苏思必驰科技25Java实习面经
  • 杰和科技工业计算机AF208,打造高可靠新能源汽车检测产线
  • Valgrind Cachegrind 全解析:用缓存效率,换系统流畅!
  • 基于springboot+vue+mysql的在线教育系统(源码+论文)
  • 多级缓存(亿级流量缓存)
  • 布局AI +文化新赛道,浙江省文化产业投资集团赴景联文科技调研交流
  • 滚珠导轨:物流输送与包装分拣的“高速轨道”
  • 前端包管理工具深度对比:npm、yarn、pnpm 全方位解析
  • 如何解决pip安装报错ModuleNotFoundError: No module named ‘pytest’问题
  • Java 实现 TCP 一发一收通信
  • GitHub+Git新手使用说明
  • Unreal ARPG笔记
  • 讯飞输入法3.0.1742功能简介
  • SpringMVC学习笔记
  • vue3实现可视化大屏布局
  • 数组习题及答案
  • f4硬件配置spi
  • 一维DP深度解析