使用Tweepy基于语言过滤tweets

2024-05-19 02:26:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我用tweepy来流媒体和捕捉一个项目中有关名人的tweet,我意识到有一半的数据不是英语的(我现在需要用英语来分析)。那么,有没有一种方法可以根据tweet的语言过滤流媒体,或者某种程度上类似的过滤器呢?在


Tags: 数据项目方法语言过滤器名人tweet流媒体
1条回答
网友
1楼 · 发布于 2024-05-19 02:26:22

不幸的是,流数据不包括ISO语言代码,所以我认为唯一的方法是直接检测语言(this answer可能会有帮助)。根据流式传输的数据量,您可能希望首先存储数据,然后进行第二个进程来检测语言并丢弃所有不需要的语言。在

相关问题 更多 >

    热门问题