用于情感分析的短语语料库

2024-05-15 17:55:49 发布

您现在位置:Python中文网/ 问答频道 /正文

再见, 我正试图用python编写一个情感分析应用程序(使用naivebayes分类器),目的是将新闻中的短语分为正面或负面。 我很难找到合适的语料库。 我试过用“普通询问者”(http://www.wjh.harvard.edu/~inquirer/homecat.htm)这行得通,但我有一个大问题。 由于它是一个单词表,而不是短语列表,因此在尝试为以下句子添加标签时,我发现了以下问题:

He is not expected to win.

这句话被归为肯定句,这是错误的。原因是“赢”是积极的,但“不”没有任何意义,因为“不赢”是一个短语。 有人能为这个问题提出一个语料库或解决办法吗? 非常感谢你的帮助和洞察力。在


Tags: 目的应用程序http分类器www新闻情感语料库
2条回答

在这种情况下,工作而不是修改了短语expecteed to win的含义,将其颠倒过来。为了确定这一点,你需要给句子加POS标记,并在动词短语(我认为)上加上否定副词not。我不知道是否有一个语料库可以告诉你not是否是这种修饰语。在

例如,参见Council、McDonald和Velikovich的“What's great and What's not:learning to Classification the scope of negation for improved emotion analysis”一书,作者:Council、McDonald和Velikovich

http://dl.acm.org/citation.cfm?id=1858959.1858969

以及后续行动

http://scholar.google.com/scholar?cites=3029019835762139237&as_sdt=5,33&sciodt=0,33&hl=en

例如,Morante等人,2011年

http://eprints.pascal-network.org/archive/00007634/

相关问题 更多 >