从字符串中提取所有名词

2024-05-13 05:03:16 发布

您现在位置:Python中文网/ 问答频道 /正文

Possible Duplicate:
Extracting nouns from Noun Phase in NLP

有没有人举一些例子来说明如何使用Python的NLTK从字符串中提取所有名词?

例如,我有一条线:“我喜欢西红柿和莴苣”。我想建立一个返回“番茄”和“莴苣”的方法

如果不是在Python中,有人知道其他的解决方案吗?


Tags: 字符串infromnlp例子nounextracting番茄
2条回答

获取NLTK包,然后使用它的内置解析器this method;或者,更快地,part-of-speech tag字符串并获取所有具有标记NN的单词,这些是名词。阅读语音标签的其他部分,了解如何正确提取Ilike

这两种方法都不是完美无缺的,但都是你能做的最好的。在干净的输入下,一个好的词性标记器的准确率将达到95%以上。我认为如果没有大量的额外工作,使用基于WordNet的方法就无法达到这样的精度。

Dave Taylor使用Bash编写了一个adlib生成器,它查询Princetons wordnet来完成这项工作。当然,可以使用wordnets帮助在python中做一些非常类似的事情。

这是链接

Linux Journal - Dave Taylor adlib generator.

相关问题 更多 >