使用xml.dom.minidom在Python中计数XML标签数量

3 投票
3 回答
10564 浏览
提问于 2025-04-17 16:00

我的XML文件test.xml里面有以下标签

<?xml version="1.0" encoding="ISO-8859-1"?>
<AppName>
    <author>Subho Halder</author>
    <description> Description</description>
    <date>2012-11-06</date>
        <out>Output 1</out>
        <out>Output 2</out>
        <out>Output 3</out>
</AppName>

我想统计一下<out>标签出现的次数

这是我目前写的Python代码:

from xml.dom.minidom import parseString
file = open('test.xml','r')
data = file.read()
file.close()
dom = parseString(data)
if (len(dom.getElementsByTagName('author'))!=0):
    xmlTag = dom.getElementsByTagName('author')[0].toxml()
    author = xmlTag.replace('<author>','').replace('</author>','')
    print author

有人能帮我一下吗?

3 个回答

2

如果你想的话,也可以使用ElementTree。下面这个函数可以帮你得到一个字典,字典里用标签名作为键,值是这个标签在你的XML文件中出现的次数。

import xml.etree.ElementTree as ET
from collections import Counter

def count_tags(filename):
        my_tags = []
        for event, element in ET.iterparse(filename):
            my_tags.append(element.tag)
        my_keys = Counter(my_tags).keys()
        my_values = Counter(my_tags).values()
        my_dict = dict(zip(my_keys, my_values))
        return my_dict
2

我建议你使用 lxml 这个库。

import lxml.etree
doc = lxml.etree.parse(test.xml)
count = doc.xpath('count(//out)')

你可以在 这里 找到更多关于 XPATH 的信息。

7

试试这个:len(dom.getElementsByTagName('out'))

from xml.dom.minidom import parseString
file = open('test.xml','r')
data = file.read()
file.close()
dom = parseString(data)
print len(dom.getElementsByTagName('out'))

这样会得到

3

撰写回答