文章详情页

python解析xml文件方式(解析、更新、写入)

浏览：239日期：2022-08-03 16:58:22

Overview

这篇博客内容将包括对XML文件的解析、追加新元素后写入到XML，以及更新原XML文件中某结点的值。使用的是python的xml.dom.minidom包，详情可见其官方文档：xml.dom.minidom官方文档。全文都将围绕以下的customer.xml进行操作：

<?xml version='1.0' encoding='utf-8' ?><customers> <customer ID='C001'> <name>Acme Inc.</name> <phone>12345</phone> <comments> <![CDATA[Regular customer since 1995]]> </comments> </customer> <customer ID='C002'> <name>Star Wars Inc.</name> <phone>23456</phone> <comments> <![CDATA[A small but healthy company.]]> </comments> </customer></customers>

CDATA：在XML中，不会被解析器解析的部分数据。

声明：在本文中，结点和节点被视为了同一个概念，你可以在全文的任何地方替换它，我个人感觉区别不是很大，当然，你也可以看做是我的打字输入错误。

1. 解析XML文件

在解析XML时，所有的文本都是储存在文本节点中的，且该文本节点被视为元素结点的子结点，例如：2005，元素节点，拥有一个值为 “2005” 的文本节点，“2005” 不是元素的值，最常用的方法就是getElementsByTagName()方法了，获取到结点后再进一步根据文档结构解析即可。

具体的理论就不过多描述，配合上述XML文件和下面的代码，你将清楚的看到操作方法，下面的代码执行的工作是将所有的结点名称以及结点信息输出一下：

# -*- coding: utf-8 -*-''' @Author : LiuZhian @Time : 2019/4/24 0024 上午 9:19 @Comment : '''from xml.dom.minidom import parsedef readXML(): domTree = parse('./customer.xml') # 文档根元素 rootNode = domTree.documentElement print(rootNode.nodeName) # 所有顾客 customers = rootNode.getElementsByTagName('customer') print('****所有顾客信息****') for customer in customers: if customer.hasAttribute('ID'): print('ID:', customer.getAttribute('ID')) # name 元素 name = customer.getElementsByTagName('name')[0] print(name.nodeName, ':', name.childNodes[0].data) # phone 元素 phone = customer.getElementsByTagName('phone')[0] print(phone.nodeName, ':', phone.childNodes[0].data) # comments 元素 comments = customer.getElementsByTagName('comments')[0] print(comments.nodeName, ':', comments.childNodes[0].data)if __name__ == ’__main__’: readXML()

python解析xml文件方式(解析、更新、写入)

2. 写入XML文件

在写入时，我觉得可分为两种方式：

新建一个全新的XML文件

在已有XML文件基础上追加一些元素信息

至于以上两种情况，其实创建元素结点的方法类似，你必须要做的都是先创建/得到一个DOM对象，再在DOM基础上创建new一个新的结点。

如果是第一种情况，你可以通过dom=minidom.Document()来创建；如果是第二种情况，直接可以通过解析已有XML文件来得到dom对象，例如dom = parse('./customer.xml')

在具体创建元素/文本结点时，你大致会写出像以下这样的“四部曲”代码：

①创建一个新元素结点createElement()

②创建一个文本节点createTextNode()

③将文本节点挂载元素结点上

④将元素结点挂载到其父元素上。

现在，我需要新建一个customer节点，信息如下:

<customer ID='C003'> <name>kavin</name> <phone>32467</phone> <comments> <![CDATA[A small but healthy company.]]> </comments> </customer>

代码如下：

def writeXML(): domTree = parse('./customer.xml') # 文档根元素 rootNode = domTree.documentElement # 新建一个customer节点 customer_node = domTree.createElement('customer') customer_node.setAttribute('ID', 'C003') # 创建name节点,并设置textValue name_node = domTree.createElement('name') name_text_value = domTree.createTextNode('kavin') name_node.appendChild(name_text_value) # 把文本节点挂到name_node节点 customer_node.appendChild(name_node) # 创建phone节点,并设置textValue phone_node = domTree.createElement('phone') phone_text_value = domTree.createTextNode('32467') phone_node.appendChild(phone_text_value) # 把文本节点挂到name_node节点 customer_node.appendChild(phone_node) # 创建comments节点,这里是CDATA comments_node = domTree.createElement('comments') cdata_text_value = domTree.createCDATASection('A small but healthy company.') comments_node.appendChild(cdata_text_value) customer_node.appendChild(comments_node) rootNode.appendChild(customer_node) with open(’added_customer.xml’, ’w’) as f: # 缩进 - 换行 - 编码 domTree.writexml(f, addindent=’ ’, encoding=’utf-8’)if __name__ == ’__main__’: writeXML()

python解析xml文件方式(解析、更新、写入)

3. 更新XML文件

在更新XML时，只需先找到对应的元素结点，然后将其下的文本结点或属性取值更新即可，然后保存到文件，具体我就不多说了，代码中我将思路都注释清楚了，如下：

def updateXML(): domTree = parse('./customer.xml') # 文档根元素 rootNode = domTree.documentElement names = rootNode.getElementsByTagName('name') for name in names: if name.childNodes[0].data == 'Acme Inc.': # 获取到name节点的父节点 pn = name.parentNode # 父节点的phone节点，其实也就是name的兄弟节点 # 可能有sibNode方法，我没试过，大家可以google一下 phone = pn.getElementsByTagName('phone')[0] # 更新phone的取值 phone.childNodes[0].data = 99999 with open(’updated_customer.xml’, ’w’) as f: # 缩进 - 换行 - 编码 domTree.writexml(f, addindent=’ ’, encoding=’utf-8’)if __name__ == ’__main__’: updateXML()

python解析xml文件方式(解析、更新、写入)

如有不对之处，还烦请指教~

补充知识：python 读取xml文件内容并完成修改

我就废话不多说了，还是直接看代码吧！

import osimport xml.etree.ElementTree as ETdef changesku(inputpath): listdir = os.listdir(inputpath) for file in listdir: if file.endswith(’xml’): file = os.path.join(inputpath,file) tree = ET.parse(file) root = tree.getroot() for object1 in root.findall(’object’): #我要修改的元素在object里面，所以需要先找到objectfor sku in object1.findall(’name’): #查找想要修改的所有同种元素 if (sku.text == ’005’): #‘005’为原始的text sku.text = ’008’ #修改‘name’的标签值 tree.write(file,encoding=’utf-8’) #写进原始的xml文件，不然修改就无效，‘encoding = “utf - 8”’避免原始xml #中文字符乱码 else: pass else: passif __name__ == ’__main__’: inputpath = ’D:easyhebing_xml’ #这是xml文件的文件夹的绝对地址 changesku(inputpath)

以上这篇python解析xml文件方式(解析、更新、写入)就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持好吧啦网。

Python 编程

上一条：使用python执行shell脚本并动态传参及subprocess的使用详解下一条：python批量替换文件名中的共同字符实例

相关文章：

1. 哪些是python中web开发框架2. 基于Vue+Webpack拆分路由文件实现管理3. idea打开多个窗口的操作方法4. 2017 年 9 月：15 个有趣的 JS 和 CSS 库5. 关于Js中new操作符的作用详解6. Docker 容器健康检查机制7. JAVA | Guava EventBus 使用发布/订阅模式的步骤8. python中的插入排序的简单用法9. php查看一个变量的占用内存的实例代码10. js和jquery实现tab状态栏切换效果

排行榜

					
					基于Vue+Webpack拆分路由文件实现管理
2017 年 9 月：15 个有趣的 JS 和 CSS 库
js和jquery实现tab状态栏切换效果
Django中如何使用Channels功能
Docker 容器健康检查机制
IntelliJ IDEA设置默认浏览器的方法
idea打开多个窗口的操作方法
php查看一个变量的占用内存的实例代码
关于Js中new操作符的作用详解
哪些是python中web开发框架
JAVA | Guava EventBus 使用 发布/订阅模式的步骤
				

热门标签