擅长:python、mysql、java
<p>我遇到了同样的问题,在网上搜索没有答案,然后发现其实可以用<code>WordNet</code><code>lemmatizer</code>中的<code>nltk</code>来完成。在</p>
<p>回想一下,<a href="https://wordnet.princeton.edu/man/wndb.5WN.html#toc3" rel="nofollow">WordNet</a>有那些简化的pos标记:</p>
<pre><code>n NOUN
v VERB
a ADJECTIVE
s ADJECTIVE SATELLITE
r ADVERB
</code></pre>
<p>其中,形容词标记<code>a</code>和{<cd5>}可用于规范化。在</p>
^{pr2}$
<p>这里第二个参数起到了神奇的作用。如果留空,则默认为<code>'n'</code>,或<code>lemmatize()</code>中的<code>wordnet.NOUN</code>。类似地,它应该明确地放在<code>'v'</code>或{<cd10>}来规范化动词和副词。在</p>