Python解析XML(使用模式生成数据集)
我想用Python来解析一个xml文件,想知道有没有什么方法可以自动化这个过程,而不是手动去逐个查看所有的xml节点和属性,使用的是xml.dom.minidom库。
简单来说,如果我能加载一个xml文件的模式(schema),然后自动生成一个包含xml中所有数据的数据结构,那就太好了。
在C#中,可以通过从xml模式创建一个强类型的数据集类,然后用这个数据集来读取xml文件。
在Python中有没有类似的功能呢?
3 个回答
-1
嘿,兄弟,试试BeautifulSoup吧,它是个非常棒的库。去网站scraperwiki.com看看。
他们能帮你!
0
你可以看看 lxml.objectify
,特别是里面的 E-factory。虽然它和 ADO 工具不完全一样,但你可能还是会觉得它有用。
3
lxml 是一个非常强大的 XML 解析工具包。它里面有一个子包 lxml.objectify,可以把你的 XML 数据变成一个对象树。
它并不会根据你的数据结构自动生成一个类——这通常是 C# 或 Java 的做法——但它可以进行数据结构的验证,这样你就能知道你得到的是什么类型的对象(可以参考“断言数据结构”)。