如何使用Python的分类库来管理Python的分类,但实际上如何使用Python的corxti/category来装载我的文本?在
>>> from nltk.corpus.reader import CategorizedPlaintextCorpusReader
>>> reader = CategorizedPlaintextCorpusReader('/ebs/category', r'.*\.txt', cat_pattern=r'(.*)\.txt')
>>> len(reader.categories())
234
假设您想要一个朴素的Bayes分类器,它具有单词包功能:
得到的
clf
的classify
方法可以用于任何FreqDist
的单词。在(但请注意:从你的
cap_pattern
看来,你的语料库中每个文件都有一个样本和一个类别。请检查一下这是否真的是你想要的。)相关问题 更多 >
编程相关推荐