擅长:python、mysql、java
<p>有两个因素会立即出现在我的脑海中,但是您可能需要先用您的数据集验证它。在</p>
<ol>
<li>单词类型的权重。通常组合词是由名词组成的,所以如果你可以在<code>N + Q</code>和{<cd2>}之间进行选择,<code>N + N</code>可能是正确的解决方案。从我的脑子里,我想不出一个例子,你更喜欢某个名词,但这一点你应该检查一下</li>
<li>单数和复数的重量。尤其是中间的“s”通常是复数形式的s,所以更喜欢<code>S + X</code>而不是{<cd5>}</li>
</ol>