擅长:python、mysql、java
<p>获取<a href="http://nltk.org" rel="nofollow noreferrer">NLTK</a>包,然后使用它的内置解析器<a href="https://stackoverflow.com/questions/5143788/extracting-nouns-from-noun-phase-in-nlp">this method</a>;或者,更快地,<a href="http://www.nltk.org/book/ch05.html" rel="nofollow noreferrer">part-of-speech tag</a>字符串并获取所有具有标记<code>NN</code>的单词,这些是名词。阅读语音标签的其他部分,了解如何正确提取<code>I</code>和<code>like</code>。</p>
<p>这两种方法都不是完美无缺的,但都是你能做的最好的。在干净的输入下,一个好的词性标记器的准确率将达到95%以上。我认为如果没有大量的额外工作,使用基于WordNet的方法就无法达到这样的精度。</p>