我试图在购买域名后使用python解析xml输出。到目前为止,我已经:
#!/usr/bin/python
import sys
from BeautifulSoup import BeautifulSoup, BeautifulStoneSoup
file = sys.argv[1]
xml = open(file).read()
soup = BeautifulStoneSoup(xml)
response = soup.find('ApiResponse')
print response
我使用的XML输出格式非常错误,必须清理。在
^{pr2}$这是pastebin上的“xml”。在
我试图找到ApiResponse Status
,它是ERROR
或{
那里的XML绝对没有问题。在
问题是XML嵌入在JSON中,JSON本身嵌入在某种我无法立即识别的对象中。(我的怀疑是,您刚刚从您用来发出请求的任何框架中抛出了某种对象的
repr
,这是一件愚蠢的事情……)所以,以适当的方式解析顶级的东西,不管它是什么格式。(如果您不知道它是从哪里来的,看起来您可以很容易地完成
.partition('=>')[-1]
)然后用json.loads
解析JSON。然后得到结果dict的['content']
,这是XML,可以用BeautifulSoup
解析它。那你就完了。在换句话说:
相关问题 更多 >
编程相关推荐