在NLTK 3.0中使用Wordnet从Synset中提取单词

2024-05-12 13:36:11 发布

您现在位置:Python中文网/ 问答频道 /正文

前段时间,有人这样问how to retrieve a list of words for a given synset使用NLTK的wordnet包装器。以下是建议的答复之一:

for synset in wn.synsets('dog'):
    print synset.lemmas[0].name

使用NLTK 3.0运行此代码会产生TypeError: 'instancemethod' object is not subscriptable

我尝试了以前提出的每一个解决方案(在上面链接的页面上描述的每一个解决方案),但是每一个都会抛出一个错误。因此我想问:是否可以用NLTK 3.0打印语法集列表的单词?我会感谢其他人在这个问题上提出的任何建议。


Tags: oftoinfor解决方案建议givenwordnet
2条回答

使用:

wn.synset('dog.n.1').name() 

而不是:

wn.synset('dog.n.1').name 

因为NLTK更改了Synset属性以获取函数。见https://github.com/nltk/nltk/commit/ba8ab7e23ea2b8d61029484098fd62d5986acd9c

这是对NLTK的API的一个很好的更改列表,以适合py3.x:https://github.com/nltk/nltk/wiki/Porting-your-code-to-NLTK-3.0

WordNet在NLTK 3.0中运行良好。你只是以错误的方式访问引理(和名称)。请改为:

>>> import nltk
>>> nltk.__version__
'3.0.0'
>>> from nltk.corpus import wordnet as wn
>>> for synset in wn.synsets('dog'):
    for lemma in synset.lemmas():
        print lemma.name()


dog
domestic_dog
Canis_familiaris
frump
dog
dog
cad
bounder
blackguard
...

synset.lemmas是一个方法,没有__getitem__()方法(因此是不可订阅的)。

相关问题 更多 >