如何在NLTK中保存自定义分类语料库

0 投票
1 回答
1315 浏览
提问于 2025-04-17 20:13

怎么把一个新的语料库“保存”到NLTK的语料库数据里呢?

在我的情况下,我按照这个页面的说明创建了一个新的自定义分类语料库:在NLTK和Python中创建自定义分类语料库

我想像使用NLTK中已经安装的语料库(比如movie_reviews)一样来使用它。我该怎么做呢?换句话说,我怎么能像这样调用我新创建的语料库(比如movie_reviews_0):

>>> import nltk
>>> from nltk.corpus import movie_reviews_0

1 个回答

3

你可以把它放到你自己的 nltk_data/corpora 文件夹里,这个文件夹应该在你的家目录下。如果你用的是Mac电脑,这个文件夹通常在 ~/nltk_data/corpora 里。另外,你还需要把你新添加的语料库加到 __init__.py 文件里,这个文件在 .../site-packages/nltk/corpus/ 这个路径下。

撰写回答