抓取RSS抓取系统
我刚学Python大约两个月,基本上都是自己学的,觉得很有意思。我想设计一个程序,能够从国家气象局抓取文本RSS信息,但我不知道从哪里开始。我想要一个可以扫描严重天气,比如龙卷风预警等,并把这些信息发送到我的邮箱的程序。我已经写了一个简单的邮件提醒系统,甚至可以发短信到我的手机。我想问问大家,能不能给我一些建议,告诉我怎么去做一个RSS抓取器,并把它和邮件程序结合起来,做一个实用的天气预警系统?我超级喜欢天气,如果你能看出来的话,这个项目将会是我的毕业设计,希望能给我的气象学教授留下深刻印象。任何帮助我都非常感激。谢谢,Andrew :D
3 个回答
1
你可以使用Scrapy。Scrapy是一个非常好用的网页抓取工具,算是最新最棒的之一。你可以用它来抓取任何网页上的内容,学会它是很有价值的。
2
你需要一个RSS订阅源解析器。解析完这些订阅源后,你就能得到所有你需要的相关信息。可以看看这个叫feedparser的工具:http://code.google.com/p/feedparser/
10
别自己去重新发明轮子,直接用 FeedParser 就行。它能处理各种复杂情况和奇怪的标记,比你自己去做要强得多。