2024-06-02 05:34:25 发布
网友
我试图在一个评论数据集上做情绪分析。由于我更关心在评论中识别(提取)负面情绪(现在没有标记,但我尝试手动标记几百个或使用炼金术API),如果评论总体上是中性或积极的,但有一部分有负面情绪,我希望我的模型更倾向于将其视为负面评论。有人能给我一些建议吗?我正在考虑使用单词包/word2vect和监督(random forest,SVM)/无监督学习模型(Kmeans)。在
用词袋法你可以给否定词更多的权重。默认值为-1表示否定词,+1表示肯定词。在
library(qdap) Dict <- key.pol Dict$y <- ifelse(Dict$y==-1,-3,Dict$y) # explore on small chat polarity("Food is good i like it. The delivery is bad",polarity.frame = Dict)$all
在这里,尽管有两个积极的词,它的消极。在
当你注解情绪时,不要标注“积极”、“消极”和“中性”。相反,将它们注释为“has negative”或“does not have negative”。那么你的情绪分类只关注特征对负面情绪的影响程度,这似乎是你想要的。在
用词袋法你可以给否定词更多的权重。默认值为-1表示否定词,+1表示肯定词。在
在这里,尽管有两个积极的词,它的消极。在
当你注解情绪时,不要标注“积极”、“消极”和“中性”。相反,将它们注释为“has negative”或“does not have negative”。那么你的情绪分类只关注特征对负面情绪的影响程度,这似乎是你想要的。在
相关问题 更多 >
编程相关推荐