我能用VaderMotion计算英语以外语言的极性和主观性吗?

2024-04-24 23:00:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试创建一个nlp项目,计算非英语文本的极性和主观性,这样我就可以使用两个工具:Vader-Textblob

在我做了大量研究之后,我发现维德在社交媒体上更高效、更准确

我的问题是:我可以为维德添加语言来计算socres吗? 或者他们的软件包是维德式的多语言软件包

对于这个项目,我从csv文件中读取并将其导入dataframe,然后进行预处理,清理文本,然后进行分析,以提取情感

我将感谢任何帮助


Tags: 文件工具csv项目文本语言dataframenlp
1条回答
网友
1楼 · 发布于 2024-04-24 23:00:30

根据documentation,维德使用两种资源:

  1. 带有情绪等级的代币词典
  2. 定义单词之间关系的一组语法规则

虽然您可以为其他语言创建自己的资源,但作者指出

Manually creating (much less, validating) a comprehensive sentiment lexicon is a labor intensive and sometimes error prone process

因此,尽管可能,但这并不容易。维德附带的词典文件仅包含8000个条目。我不知道生成这些结果有多容易:大概在快速实现广泛覆盖和结果准确性之间存在权衡。也许您可以先考虑覆盖率,然后通过相应地修改条目来逐步提高准确性

句法规则(粗略地看)似乎主要描述副词,以及副词是增加还是减少情绪。同样,这是需要调整的,因为它在源文件中是硬编码为英语的。这取决于你的目标语言在语法上与英语有多不同,这项任务有多容易或难

相关问题 更多 >