我正在尝试使用Python和beautiful soup从嵌套的XML站点地图中抓取URL
我想我记下了第一部分。我构建了一个简单的循环来访问主XML站点地图,并提取符合特定条件的XML列表。然后将XML索引存储在一个列表中
下一部分是它变得模糊的地方
我试图循环浏览上面列表中的每一项,拉出每个URL,并将输出附加到一个新列表中,该列表将被写入文本文件
这是我在这一部分的代码:
当我循环并构建列表时,我得到了一个奇怪的输出:
我的第一个想法是Python在每一个换行符后都附加“/n”。但当我尝试循环浏览URL时,我得到了以下结果:
任何帮助或指导都将不胜感激
干杯
Tags:
不知何故,python在本例中没有将\n解释为换行符(可能是因为XML内容的编组)。这就是为什么它不是一个合法的URL,而您从请求中得到了这个错误
一种解决方法是执行
string.split("\\n")
将URL返回到列表中相关问题 更多 >
编程相关推荐