如何在NLTK中保存自定义分类语料库
怎么把一个新的语料库“保存”到NLTK的语料库数据里呢?
在我的情况下,我按照这个页面的说明创建了一个新的自定义分类语料库:在NLTK和Python中创建自定义分类语料库
我想像使用NLTK中已经安装的语料库(比如movie_reviews)一样来使用它。我该怎么做呢?换句话说,我怎么能像这样调用我新创建的语料库(比如movie_reviews_0):
>>> import nltk
>>> from nltk.corpus import movie_reviews_0
1 个回答
3
你可以把它放到你自己的 nltk_data/corpora
文件夹里,这个文件夹应该在你的家目录下。如果你用的是Mac电脑,这个文件夹通常在 ~/nltk_data/corpora
里。另外,你还需要把你新添加的语料库加到 __init__.py
文件里,这个文件在 .../site-packages/nltk/corpus/
这个路径下。