2024-04-24 23:00:30 发布
网友
我正在尝试创建一个nlp项目,计算非英语文本的极性和主观性,这样我就可以使用两个工具:Vader-Textblob
在我做了大量研究之后,我发现维德在社交媒体上更高效、更准确
我的问题是:我可以为维德添加语言来计算socres吗? 或者他们的软件包是维德式的多语言软件包
对于这个项目,我从csv文件中读取并将其导入dataframe,然后进行预处理,清理文本,然后进行分析,以提取情感
我将感谢任何帮助
根据documentation,维德使用两种资源:
虽然您可以为其他语言创建自己的资源,但作者指出
Manually creating (much less, validating) a comprehensive sentiment lexicon is a labor intensive and sometimes error prone process
因此,尽管可能,但这并不容易。维德附带的词典文件仅包含8000个条目。我不知道生成这些结果有多容易:大概在快速实现广泛覆盖和结果准确性之间存在权衡。也许您可以先考虑覆盖率,然后通过相应地修改条目来逐步提高准确性
句法规则(粗略地看)似乎主要描述副词,以及副词是增加还是减少情绪。同样,这是需要调整的,因为它在源文件中是硬编码为英语的。这取决于你的目标语言在语法上与英语有多不同,这项任务有多容易或难
根据documentation,维德使用两种资源:
虽然您可以为其他语言创建自己的资源,但作者指出
因此,尽管可能,但这并不容易。维德附带的词典文件仅包含8000个条目。我不知道生成这些结果有多容易:大概在快速实现广泛覆盖和结果准确性之间存在权衡。也许您可以先考虑覆盖率,然后通过相应地修改条目来逐步提高准确性
句法规则(粗略地看)似乎主要描述副词,以及副词是增加还是减少情绪。同样,这是需要调整的,因为它在源文件中是硬编码为英语的。这取决于你的目标语言在语法上与英语有多不同,这项任务有多容易或难
相关问题 更多 >
编程相关推荐