2024-05-13 05:03:16 发布
网友
Possible Duplicate:Extracting nouns from Noun Phase in NLP
有没有人举一些例子来说明如何使用Python的NLTK从字符串中提取所有名词?
例如,我有一条线:“我喜欢西红柿和莴苣”。我想建立一个返回“番茄”和“莴苣”的方法
如果不是在Python中,有人知道其他的解决方案吗?
获取NLTK包,然后使用它的内置解析器this method;或者,更快地,part-of-speech tag字符串并获取所有具有标记NN的单词,这些是名词。阅读语音标签的其他部分,了解如何正确提取I和like。
NN
I
like
这两种方法都不是完美无缺的,但都是你能做的最好的。在干净的输入下,一个好的词性标记器的准确率将达到95%以上。我认为如果没有大量的额外工作,使用基于WordNet的方法就无法达到这样的精度。
Dave Taylor使用Bash编写了一个adlib生成器,它查询Princetons wordnet来完成这项工作。当然,可以使用wordnets帮助在python中做一些非常类似的事情。
这是链接
Linux Journal - Dave Taylor adlib generator.
获取NLTK包,然后使用它的内置解析器this method;或者,更快地,part-of-speech tag字符串并获取所有具有标记
NN
的单词,这些是名词。阅读语音标签的其他部分,了解如何正确提取I
和like
。这两种方法都不是完美无缺的,但都是你能做的最好的。在干净的输入下,一个好的词性标记器的准确率将达到95%以上。我认为如果没有大量的额外工作,使用基于WordNet的方法就无法达到这样的精度。
Dave Taylor使用Bash编写了一个adlib生成器,它查询Princetons wordnet来完成这项工作。当然,可以使用wordnets帮助在python中做一些非常类似的事情。
这是链接
Linux Journal - Dave Taylor adlib generator.
相关问题 更多 >
编程相关推荐