POS标记我自己的语料库

2024-06-09 21:52:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下代码

import nltk
from nltk.corpus.reader import TaggedCorpusReader

corpus_root = 'C:/Python27'
reader = TaggedCorpusReader(corpus_root, 'test.txt')
print reader.words()
print reader.tagged_words()

问题是,在结果中给我每个单词的值都是'None'。。在

^{pr2}$

当我有了密码

import nltk
text = nltk.word_tokenize("And now for something completely different")
nltk.pos_tag(text)

结果是正确的。。。在

[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ')]

出什么问题了??在


Tags: andtextimportforrootcorpusnowsomething