我有一个字符串,例如:
[{'type': 'text/html', 'value': '<table> <tr><td> <a href="https://www.reddit.com/r/wallpapers/comments/6dhhhj/waving_bear/"> <img src="https://b.thumbs.redditmedia.com/v5CaHQ_S-m4L5MUfX2a6ViwZWe2yvft_VyG8Iol0CJs.jpg" alt="Waving bear" title="Waving bear" /> </a> </td><td>   submitted by   <a href="https://www.reddit.com/user/mexicanwave"> /u/mexicanwave </a> <br/> <span><a href="http://i.imgur.com/PMgfJSm.jpg">[link]</a></span>   <span><a href="https://www.reddit.com/r/wallpapers/comments/6dhhhj/waving_bear/">[comments]</a></span> </td></tr></table>', 'base': 'https://www.reddit.com/r/wallpapers.rss', 'language': None}]
我想从这个字符串中提取包含imgur.com的url
最简单的方法是什么
使用XML/HTML解析器是处理XML/HTML文档/框架集的正确方法:
输出:
https://docs.python.org/3.6/library/xml.etree.elementtree.html
我建议你用漂亮的汤。因为您已经有一个HTML代码作为字符串。请参阅以下代码段。现在您已经有了所有的锚定标记,您可以进一步从theorhrefs中查找子字符串“imgur.com”,并获得特定的链接
相关问题 更多 >
编程相关推荐