如何通过Reddit API获取超过1000张图片?
我写了一个从Reddit上抓取图片的程序,但Reddit的接口只让我获取最新的1000张图片。有没有人知道我是否可以付钱来获取更多的数据(比如几万张),或者有没有免费的解决办法?
1 个回答
4
reddit的API最多只能让我获取到最新的1000张图片。
我想你是说这个列表最多只能显示1000条提交记录。这是一个硬性限制,适用于所有reddit的列表,除了http://www.reddit.com/new(据我所知)。目前没有办法付费来获取更多的API访问权限。不过,只要你遵守reddit的API规则,你可以使用http://www.reddit.com/new这个列表,向回查找你想要的内容,并且可以过滤掉你不关心的子版块提交。
这里有一个简单的PRAW示例,它统计了在最近10000条提交中,某些子版块的提交数量(运行大约需要200秒)。
import praw
r = praw.Reddit('stackoverflow question test')
subs = set(['aww', 'funny'])
count = 0
for submission in r.get_new(limit=10000):
if submission.subreddit.display_name.lower() in subs:
count += 1
print(count)