Python解析XML(使用模式生成数据集)

1 投票
3 回答
1033 浏览
提问于 2025-04-16 06:17

我想用Python来解析一个xml文件,想知道有没有什么方法可以自动化这个过程,而不是手动去逐个查看所有的xml节点和属性,使用的是xml.dom.minidom库。

简单来说,如果我能加载一个xml文件的模式(schema),然后自动生成一个包含xml中所有数据的数据结构,那就太好了。

在C#中,可以通过从xml模式创建一个强类型的数据集类,然后用这个数据集来读取xml文件。

在Python中有没有类似的功能呢?

3 个回答

-1

嘿,兄弟,试试BeautifulSoup吧,它是个非常棒的库。去网站scraperwiki.com看看。

他们能帮你!

0

你可以看看 lxml.objectify,特别是里面的 E-factory。虽然它和 ADO 工具不完全一样,但你可能还是会觉得它有用。

3

lxml 是一个非常强大的 XML 解析工具包。它里面有一个子包 lxml.objectify,可以把你的 XML 数据变成一个对象树。

它并不会根据你的数据结构自动生成一个类——这通常是 C# 或 Java 的做法——但它可以进行数据结构的验证,这样你就能知道你得到的是什么类型的对象(可以参考“断言数据结构”)。

撰写回答