kateli1991

Python中的Stanford实体识别器(caseless)



我试图弄清楚如何使用NLTK中的实体识别器的无实例版本。我下载了http://nlp.stanford.edu/software/stanford-ner-2015-04-20.zip并将其放在python的site packages文件夹中。然后我下载了http://nlp.stanford.edu/software/stanford-corenlp-caseless-2015-04-20-models.jar并将其放入文件夹中。然后我在NLTK中运行了这个代码

from nltk.tag.stanford import NERTagger
english_nertagger = NERTagger(‘/home/anaconda/lib/python2.7/site-packages/stanford-ner-2015-04-20/classifiers/english.conll.4class.distsim.crf.ser.gz’, ‘/home/anaconda/lib/python2.7/site-packages/stanford-ner-2015-04-20/stanford-corenlp-caseless-2015-04-20-models.jar’)

但当我运行这个:

^{pr2}$

我得到一个错误:

Error: Could not find or load main class edu.stanford.nlp.ie.crf.CRFClassifier

如果你有经验,任何帮助都将不胜感激!在

另外,我可以让非caseless版本运行良好,但我发现在分析搜索查询时,用户几乎从不大写单词,而非caseless版本如果不大写的话,似乎完全漏掉了单词。在


已被浏览了10760次
6 日,19 小时 之前提问
1 个回答
fefe Tyson

StanfordNERTagger的第二个参数是stanford tagger jar文件的路径,而不是模型的路径。所以,把它改成stanford-ner.jar(当然,放在那里)。在

另外,似乎你应该选择english.conll.4class.caseless.distsim.crf.ser.gz(摘自stanford-corenlp-caseless-2015-04-20)-模型.jar)而不是english.conll.4class.distsim.crf.ser.gz

因此,请尝试以下操作:

 english_nertagger = StanfordNERTagger(‘/home/anaconda/lib/python2.7/site-packages/stanford-ner-2015-04-20/classifiers/english.conll.4class.caseless.distsim.crf.ser.gz’, ‘/home/anaconda/lib/python2.7/site-packages/stanford-ner-2015-04-20/stanford-ner.jar’)

升级版。NERTagger已重命名为StanfordNERTagger

评论 - 2020年7月29日 10:44

最新Python问答

推荐Python问答