处理XML--xml.etree.ElementTree

发布时间 2023-12-01 17:32:56作者: 黑逍逍

XML文档的根元素

根元素是XML文档中所有其他元素的父元素。它是文档的起点,必须是唯一的
<root> <!-- 其他元素和内容 --> </root>

  

介绍xml信息

属性类型意义调用
tag str Element名 Element.tag
attrib dic 元素有哪些属性 Element.attrib
text str 第一个子元素之前的文本。 Element.text
tail str 在元素结束标记之后,下一个元素开始标记之前的文本。 Element.tail

  attrib

  案例1

    

   案例2

    

 

 

# 从文件解析XML文档
tree = ET.parse('your_xml_file.xml')
# 获取根元素
root = tree.getroot()

  

查找

find方法:查找第一个匹配的元素。
element = root.find('.//your_element')

findall方法:查找所有匹配的元素。 elements = root.findall('.//your_element')


1. 查找某个节点下的元素

这是获取了全部,共6个内容

keywords = root.findall(".//keywords/keyword")

 2. 但是不要

<keywords xml:lang="en">的部分,

  

获取属性

获取属性
root.find('.//sourceinfo').get('id')

<sourceinfo id="123" type="journal">
    <!-- 其他内容 -->
</sourceinfo>