2024-04-23 21:52:29 发布
网友
我在尝试一点点用于短文的api并使其正常工作。它返回给我的脚本一个xml文档。我想提取出标签,但似乎无法正确解析它。在
askfor = urllib2.Request(full_url) response = urllib2.urlopen(askfor) the_page = response.read()
因此,_页面包含xml文档。我试过了:
这会导致错误。我做错什么了?在
你没有提供错误消息,所以我不能确定这是唯一的错误。但是,xml.minidom.parse不接受字符串。从parse的docstring:
xml.minidom.parse
parse
Parse a file into a DOM by filename or file object.
你应该试试:
response = urllib2.urlopen(askfor) doc = parse(response)
因为response的行为类似于文件对象。或者您可以在minidom中使用parseString方法(然后将the_page作为参数传递)。在
response
minidom
parseString
the_page
编辑:要提取URL,需要执行以下操作:
getElementsByTagName的结果是所有匹配节点的列表(在本例中只有一个节点)。url是您注意到的一个元素,它包含一个子文本节点,它包含您需要的数据。在
getElementsByTagName
url
from xml.dom.minidom import parseString doc = parseString(the_page)
请参阅^{}的文档。在
你没有提供错误消息,所以我不能确定这是唯一的错误。但是,
xml.minidom.parse
不接受字符串。从parse
的docstring:你应该试试:
因为
response
的行为类似于文件对象。或者您可以在minidom
中使用parseString
方法(然后将the_page
作为参数传递)。在编辑:要提取URL,需要执行以下操作:
^{pr2}$getElementsByTagName
的结果是所有匹配节点的列表(在本例中只有一个节点)。url
是您注意到的一个元素,它包含一个子文本节点,它包含您需要的数据。在请参阅^{} 的文档。在
相关问题 更多 >
编程相关推荐