很好的python XML解析器,可以处理命名空间繁重的文档

2024-06-09 17:00:37 发布

您现在位置:Python中文网/ 问答频道 /正文

Python elementTree对于名称空间似乎不可用。我的选择是什么? BeautifulSoup在名称空间上也是垃圾。 我不想把他们脱光。

特定python库如何获得命名空间元素及其集合的示例都是+1。

编辑:您能提供代码来使用您选择的库处理这个现实世界的用例吗?

如何获取字符串“换行符”、“2.6”和列表[“PYTHON”、“XML”、“XML-NAMESPACES”]

<?xml version="1.0" encoding="UTF-8"?>
<zs:searchRetrieveResponse
    xmlns="http://unilexicon.com/vocabularies/"
    xmlns:zs="http://www.loc.gov/zing/srw/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:lom="http://ltsc.ieee.org/xsd/LOM">
    <zs:records>
        <zs:record>
            <zs:recordData>
                <srw_dc:dc xmlns:srw_dc="info:srw/schema/1/dc-schema">
                    <name>Line Break</name>
                    <dc:title>Processing XML namespaces using Python</dc:title>
                    <dc:description>How to get contents string from an element,
                        how to get a collection in a list...</dc:description>
                    <lom:metaMetadata>
                        <lom:identifier>
                            <lom:catalog>Python</lom:catalog>
                            <lom:entry>2.6</lom:entry>
                        </lom:identifier>
                    </lom:metaMetadata>
                    <lom:classification>
                        <lom:taxonPath>
                            <lom:taxon>
                                <lom:id>PYTHON</lom:id>
                            </lom:taxon>
                        </lom:taxonPath>
                    </lom:classification>
                    <lom:classification>
                        <lom:taxonPath>
                            <lom:taxon>
                                <lom:id>XML</lom:id>
                            </lom:taxon>
                        </lom:taxonPath>
                    </lom:classification>
                    <lom:classification>
                        <lom:taxonPath>
                            <lom:taxon>
                                <lom:id>XML-NAMESPACES</lom:id>
                            </lom:taxon>
                        </lom:taxonPath>
                    </lom:classification>
                </srw_dc:dc>
            </zs:recordData>
        </zs:record>
        <!-- ... more records ... -->
    </zs:records>
</zs:searchRetrieveResponse>

Tags: 名称idhttp空间xmldcclassificationsrw