2024-05-19 02:26:22 发布
网友
我用tweepy来流媒体和捕捉一个项目中有关名人的tweet,我意识到有一半的数据不是英语的(我现在需要用英语来分析)。那么,有没有一种方法可以根据tweet的语言过滤流媒体,或者某种程度上类似的过滤器呢?在
不幸的是,流数据不包括ISO语言代码,所以我认为唯一的方法是直接检测语言(this answer可能会有帮助)。根据流式传输的数据量,您可能希望首先存储数据,然后进行第二个进程来检测语言并丢弃所有不需要的语言。在
不幸的是,流数据不包括ISO语言代码,所以我认为唯一的方法是直接检测语言(this answer可能会有帮助)。根据流式传输的数据量,您可能希望首先存储数据,然后进行第二个进程来检测语言并丢弃所有不需要的语言。在
相关问题 更多 >
编程相关推荐