将Twitter Tweets传输到txt-fi

from tweepy import Stream from tweepy import OAuthHandler from tweepy.streaming import StreamListener import json from pprint import pprint data_file = open('twitter.json') data = json.load(data_file) ##Json file with all the ckey, csecret, atoken, and asecret pprint(data) #consumer key, consumer secret, access token, access secret. ckey = data["ckey"] csecret = data["csecret"] atoken = data["atoken"] asecret = data["asecret"] class listener(StreamListener): def on_data(self, data): all_data = json.loads(data) tweet = all_data["text"] username = all_data["user"]["screen_name"] print((username,tweet)) return True def on_error(self, status): print (status) auth = OAuthHandler(ckey, csecret) auth.set_access_token(atoken, asecret)

3条回答

网友

1楼 · 编辑于 2024-04-19 03:39:12

我在一个项目中完成了这项工作，我的方法涉及在StreamListener对象中更改on_data方法。我的代码如下：

class Listener(StreamListener):
    def __init__(self, api=None, path=None):
        #I don't remember exactly why I defined this.
        self.api = api
        #We'll need this later.
        self.path = path

    def on_data(self, data):
        all_data = json.loads(data)

        tweet = all_data["text"]        
        username = all_data["user"]["screen_name"]
        print((username,tweet))

        #Open, write and close your file.
        savefile = open(file_path, 'ab')
        savefile.write(tweet)
        savefile.close()

        return True

实际代码中的一些内容，而不是重新定义Listener或on_data的地方。按顺序：

定义要保存的文件。我们把这个变量称为file_path。别忘了在这里添加.txt扩展名。

调用流和侦听器：

twitterStream = Stream(authorization, Listener(path=file_path))

使用过滤器。我的是坐标，我试了一下过滤器，只是我的代码没有停止。这里是为您改编的：
```
try:
    twitterStream.filter(track=[cats])
except Exception, e:
    print 'Failed filter() with this error:', str(e)
```

现在tweet中的文本应该在流中出现文本时写入文件。看看你的文件大小，你会发现它在增加。特别是，如果你的过滤器是关于猫的。网络爱猫。

网友

2楼 · 编辑于 2024-04-19 03:39:12

请参阅下面的链接，然后您将了解如何将tweets保存到数据库以及本地文件。

https://github.com/anandstarz/Scrapee/blob/master/tweets

网友

3楼 · 编辑于 2024-04-19 03:39:12

我想您提供的代码片段中有一个轻微的缩进错误，但是我将尝试使用两种方法来修复您的错误，第一种方法是通过更正缩进，第二种方法是更改您的on_data方法

方法1：

fid = open("cats based tweets.txt","w")
for tweet in twitterStream.filter(track=[cats]):
    fid.write(tweet+"\n")
fid.close()

或者您可以简单地将上述代码编写为：

with open("cats based tweets.txt","w") as fid:
    for tweet in twitterStream.filter(track=[cats]):
        fid.write(tweet+"\n")

方法2：

在第二种方法中，我们可以更改on_data方法，这样当程序接收到新的tweet时，它会打开文件并直接写入其中，但为此，我们需要以追加模式打开文件，因为以w可写模式打开文件会一次又一次地覆盖文件的内容。

def on_data(self, data):
    all_data = json.loads(data)       
    tweet = all_data["text"]        
    username = all_data["user"]["screen_name"]
    print((username,tweet))
    with open("cats based tweets.txt","a") as fid:
        fid.write(tweet+"\n")
    return True

相关问题更多 >

编程相关推荐

热门问题

热门文章