我不熟悉nltk和python。我试图使用evaluate特性来测试我阅读的文本文档的准确性。这就是我目前所拥有的。在
from nltk.tag import UnigramTagger
from nltk.corpus import treebank
from nltk.tokenize import word_tokenize
train_sents = treebank.tagged_sents()
tagger = UnigramTagger(train_sents)
text1 = "This is the first sentence. Now this is another one!
How many do you plan to write?"
words = word_tokenize(text1)
value = tagger.tag(words)
accuracy = tagger.evaluate(words)
我不能用这个来计算准确度。我得到以下错误。在
ValueError:需要多于1个值才能解压缩。在
我不知道该怎么改正。谢谢。在
要使用NLTK训练和使用
UnigramTagger
,请执行以下操作:tagger需要评估标签上的句子。
UnigramTagger.evaluate()
的输入是一个元组列表,其中元组中的第一项是单词,元组中的第二项是POS(即与UnigramTagger.train()
函数相同的输入类型)。 . 在见https://github.com/nltk/nltk/blob/develop/nltk/tag/api.py#L53 我们先把树库句子分成两部分,90%和10%:
^{pr2}$相关问题 更多 >
编程相关推荐