从RSS提要中的链接下载
我想创建一个文件夹,用来存放从RSS源收集的新闻文章。也就是说,每当RSS源里有一篇文章的链接时,我希望能把它下载到一个文件夹里,并且用这篇文章的标题作为文件名,保存为文本文件。
请问Python能帮我做到这一点吗?
谢谢你的帮助 :-)
2 个回答
1
当然可以。BeautifulSoup、lxml、urllib2 和 urlgrabber。
2
你可以使用 feedparser 来解析RSS订阅源,使用 urllib2 来下载文件。如果你需要解析HTML网页,可以使用 BeautifulSoup。如果你在使用这些工具时遇到问题,可以提出更具体的问题。