擅长:python、mysql、java
<p>一个简单的方法是使用解析器将训练集分解成最小的句子,并将其用作标签和情感分类的输入。在</p>
<p>你的例句:</p>
<pre><code>The Xbox One has a good selection of games but the performance is worse than the PS4
</code></pre>
<p>使用<a href="http://nlp.stanford.edu:8080/parser/index.jsp" rel="nofollow noreferrer">Stanford Parser</a>,获取没有子S标记的S标记(因此是最小的句子),并将标记放回一起。对于上面的句子,你可以得到:</p>
^{pr2}$
<p>S标签中的情绪在大多数时候应该是一致的。如果像<code>The XBox has good games and terrible graphics</code>这样的句子在你的数据集中很常见,你可能需要把它分解成NP标记,但这似乎不太可能。在</p>
<p>关于标签,正如您所提到的,任何多标签分类方法都应该有效。在</p>
<p>对于更复杂的方法,有很多关于连接主题情感模型的研究——搜索“主题情感模型”会找到很多论文和代码。下面是一篇介绍<a href="http://www.cs.virginia.edu/~mr4xb/paper/WWW2016_paper.pdf" rel="nofollow noreferrer">Hidden Topic Sentiment Model</a>的文章中的训练数据示例,它看起来很适合你。注意第一句话中有两个主题。在</p>
<p><a href="https://i.stack.imgur.com/H1nUO.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/H1nUO.png" alt="HTSM training data"/></a></p>
<p>希望有帮助!在</p>