再见, 我正试图用python编写一个情感分析应用程序(使用naivebayes分类器),目的是将新闻中的短语分为正面或负面。 我很难找到合适的语料库。 我试过用“普通询问者”(http://www.wjh.harvard.edu/~inquirer/homecat.htm)这行得通,但我有一个大问题。 由于它是一个单词表,而不是短语列表,因此在尝试为以下句子添加标签时,我发现了以下问题:
He is not expected to win.
这句话被归为肯定句,这是错误的。原因是“赢”是积极的,但“不”没有任何意义,因为“不赢”是一个短语。 有人能为这个问题提出一个语料库或解决办法吗? 非常感谢你的帮助和洞察力。在
在这种情况下,工作而不是修改了短语expecteed to win的含义,将其颠倒过来。为了确定这一点,你需要给句子加POS标记,并在动词短语(我认为)上加上否定副词not。我不知道是否有一个语料库可以告诉你not是否是这种修饰语。在
例如,参见Council、McDonald和Velikovich的“What's great and What's not:learning to Classification the scope of negation for improved emotion analysis”一书,作者:Council、McDonald和Velikovich
http://dl.acm.org/citation.cfm?id=1858959.1858969
以及后续行动
http://scholar.google.com/scholar?cites=3029019835762139237&as_sdt=5,33&sciodt=0,33&hl=en
例如,Morante等人,2011年
http://eprints.pascal-network.org/archive/00007634/
相关问题 更多 >
编程相关推荐