使用Python控制Twitter流API的过程
我正在写一个脚本,用Python来获取Twitter的实时数据接口(API)。我遇到的问题是,我想只收集特定时间段内的推文(比如说1小时的推文)。我使用了一个定时器对象来停止这个过程,并尝试关闭连接,但这个方法有时候有效,有时候无效。我还尝试捕捉键盘中断错误,想自动关闭连接,但这似乎也不太管用。
我想问的是:有没有合适的方法来处理实时数据接口?我该如何控制何时开始和停止获取数据流?我在考虑使用子进程,但不太确定。
谢谢!
1 个回答
2
urllib2 是一个会阻塞的接口,并且它会进行数据缓冲。这意味着在某个特定时刻,你很难干净利落地中断它的读取操作。
你需要一个更灵活的 HTTP 库。这里有一个关于如何使用 Twitter 和 PyCurl 的教程。