需要帮助理解Python中etree的XML标签结构

Question

我在理解Python的etree库来读取XML文件时遇到了一些问题。对于我这个刚开始学习Python的人来说，XML有点复杂...

我在一个文件中有以下的XML结构：

    <sss version="1.2">
    <date>2011-09-23</date>
    <time>12:32:29</time>
    <origin>OPST</origin>
    <user></user>
    <survey>
        <name>Test</name>
        <version>2011-09-02 15:50:10</version>
        <record ident="A">
            <variable ident="10" type="quantity">
                <name>v_682</name>
                <label>Another question</label>
                <position start="23" finish="24"/>
                <values>
                    <range from="0" to="32"/>
                </values>
            </variable>
            <variable ident="11" type="quantity">
                <name>v_683</name>
                <label>another totally another Question</label>
                <position start="25" finish="26"/>
                <values>
                    <range from="0" to="33"/>
                </values>
            </variable>
            <variable ident="12" type="quantity">
                <name>v_684</name>
                <label>And once more Question</label>
                <position start="27" finish="29"/>
                <values>
                    <range from="0" to="122"/>
                </values>
            </variable>
            <variable ident="20" type="single">
                <name>v_685</name>
                <label>Question with alternatives</label>
                <position start="73" finish="73"/>
                <values>
                    <range from="1" to="6"/>
                    <value code="1">Alternative 1</value>
                    <value code="2">Alternative 2</value>
                    <value code="3">Alternative 3</value>
                    <value code="6">Alternative 4</value>
                </values>
            </variable>
        </record>
    </survey>
</sss>

为了读取这些元素，我写了一个很糟糕的循环，我觉得这并没有发挥etree库的真正能力...

from xml.etree.cElementTree import parse
et = parse(open('scheme.xml','rb'))
root = et.getroot()
for i in range(4):
    a= str(root[4][2][i][0].text)
    if a.startswith('v'):
        print root[4][2][i][1].text

我该如何利用标签结构呢？比如说，如何读取“value”标签的内容并把它添加到一个列表中？

对我来说，这些etree的教程实在是太难懂了...也许有人可以教我如何进行基于标签的搜索？这些循环太脆弱了...

非常感谢！

XML 数据解析学习资源循环标签结构内容提取 etree 基于标签的搜索

需要帮助理解Python中etree的XML标签结构

1 个回答

输出

撰写回答