回顾数据情绪分析,重点提取负面情绪?

2024-06-02 05:34:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图在一个评论数据集上做情绪分析。由于我更关心在评论中识别(提取)负面情绪(现在没有标记,但我尝试手动标记几百个或使用炼金术API),如果评论总体上是中性或积极的,但有一部分有负面情绪,我希望我的模型更倾向于将其视为负面评论。有人能给我一些建议吗?我正在考虑使用单词包/word2vect和监督(random forest,SVM)/无监督学习模型(Kmeans)。在


Tags: 数据标记模型api评论手动单词建议
2条回答

用词袋法你可以给否定词更多的权重。默认值为-1表示否定词,+1表示肯定词。在

library(qdap)
Dict <- key.pol
Dict$y <- ifelse(Dict$y==-1,-3,Dict$y)
# explore on small chat
polarity("Food is good i like it. The delivery is bad",polarity.frame = Dict)$all

enter image description here

在这里,尽管有两个积极的词,它的消极。在

当你注解情绪时,不要标注“积极”、“消极”和“中性”。相反,将它们注释为“has negative”或“does not have negative”。那么你的情绪分类只关注特征对负面情绪的影响程度,这似乎是你想要的。在

相关问题 更多 >