当我想使用BeautifulSoup库在Python中解析XML文档时, 我遇到了一些问题。我要分析的XML文档:
<item>
<title><![CDATA[Title Sample]]></title>
<link /><![CDATA[http://banhada.kr/?cateCode=09&viewCode=S0941580]]>
<time_start>2011-10-10 09:00:00</time_start>
<time_end>2011-10-17 09:00:00</time_end>
<price_original>35000</price_original>
<price_now>20000</price_now>
</item>
正如你在上面看到的,标签有点奇怪。在我看来,这个(标记)不是标准的XML表单,对吧?我该如何解析这个可怕的表单?
您可以使用BeautifulSoup来分析XML:
在幕后,BeautifulSoup使用lxml来解析XML。 虽然这里不需要,但您可能希望直接使用lxml,因为它提供了使用XPath在XML中导航的更简洁的方法:
你不需要美容师或lxml。Python附带的电池做得很好,而且XML似乎没有任何不兼容的地方。
相关问题 更多 >
编程相关推荐