PRAW:将评论和提交对象序列化为JSON

1 投票
1 回答
2757 浏览
提问于 2025-04-18 13:20

我现在正在用praw做一个reddit爬虫,目的是为了挖掘一些数据。我想从不同的subreddit上抓取评论和帖子,然后把它们保存到数据库或文件里,最好是用json格式,以便以后使用。

我在把评论和帖子对象转换成JSON格式时遇到了困难。请问有没有现成的方法可以做到这一点?

注意:我对python也还很陌生。

提前感谢大家的帮助!

1 个回答

2

更新 ---------

看起来这已经不再可能了,感谢Antoine的提示。

https://github.com/praw-dev/praw/issues/701

我不太确定有没有办法把你需要的内容保存下来,但你可以用下面的代码保存提交的ID:

some_id = sub.id

然后你可以用下面的代码在之后取回来:

r.get_submission(submission_id=some_id)

编辑 -----------------------------------------

我做了一些研究,发现了这个:https://github.com/praw-dev/praw/issues/271

基本上,你可以通过下面的代码开启JSON数据的存储:

r.config.store_json_result = True

然后你可以通过评论或提交的json_dict成员来访问这些JSON数据。

撰写回答