如何使用雪球的加泰罗尼亚词干分析器?

2024-06-16 14:50:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我想使用这里提供的加泰罗尼亚词干分析器: http://snowball.tartarus.org/algorithms/catalan/stemmer.html

但是,当我这样做的时候:

from nltk.stem.snowball import SnowballStemmer   
stemmer = SnowballStemmer("catalan")

上面写着:

the language Catalan is not supported

有人能帮我吗?我做错什么了?在

对于西班牙语,当我键入以下内容时,它确实有效:

^{pr2}$

非常感谢!在


Tags: fromorgimporthttp分析器htmlalgorithmsnltk
1条回答
网友
1楼 · 发布于 2024-06-16 14:50:55

你没有做错什么。源代码中提供了SnowballStemmer支持的语言,但不包括Catalan语言:

class SnowballStemmer(StemmerI):

    """
    Snowball Stemmer

    The following languages are supported:
    Danish, Dutch, English, Finnish, French, German,
    Hungarian, Italian, Norwegian, Portuguese, Romanian, Russian,
    Spanish and Swedish.

在此处找到:http://www.nltk.org/_modules/nltk/stem/snowball.html

相关问题 更多 >