python中的albic text可以用什么?

2024-04-19 17:19:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我怎样才能得到阿拉伯语单词的引理?我尝试了NLTK的ISRI阿拉伯语词干分析器,但它返回单词的词根:

from nltk.stem.isri import ISRIStemmer
st = ISRIStemmer()
print st.stem(u'اعلاميون')

它返回根“علم”,我想要引理“اعلام”


Tags: fromimport分析器单词stprintnltkstem
2条回答

最先进的是Farasa Lemmatizer。在

基于准确性,Farasa Lemmatizer优于MADAMIRA Lemmatizer。在柠檬化任务中,它的准确度比MADAMIRA高出7%。在

您可以从以下链接阅读有关Farasa Lemmatizer的更多信息: https://arxiv.org/pdf/1710.06700.pdf

我所知道的唯一阿拉伯语柠檬化软件是哥伦比亚大学制造的MADAMIRA。您可以在以下URL使用联机界面:http://nlp.ldeo.columbia.edu/madamira/

相关问题 更多 >