擅长:python、mysql、java
<pre><code>import re
import nltk
from nltk.corpus import stopwords
stop = stopwords.words('english')
from nltk.corpus import wordnet
String = 'Ravana was killed in a war'
Sentences = nltk.sent_tokenize(String)
Tokens = []
for Sent in Sentences:
Tokens.append(nltk.word_tokenize(Sent))
Words_List = [nltk.pos_tag(Token) for Token in Tokens]
Nouns_List = []
for List in Words_List:
for Word in List:
if re.match('[NN.*]', Word[1]):
Nouns_List.append(Word[0])
Names = []
for Nouns in Nouns_List:
if not wordnet.synsets(Nouns):
Names.append(Nouns)
print (Names)
</code></pre>
<p>检查此代码。我得到<code>Ravana</code>作为输出。在</p>
<p>编辑:</p>
<p>我用简历中的几句话创建了一个文本文件,并将其作为输入输入输入到我的程序中。以下仅显示代码的更改部分:</p>
^{pr2}$
<p>它返回所有不在<code>wordnet</code>语料库中的名字,比如我的名字,我的房子的名字,地方,大学的名字和地点。在</p>