用NLTK创建词性标记语料库 - 问答 - Python中文网

用NLTK创建词性标记语料库

2024-06-09 22:31:01 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我想用NLTK建立pos标记的语料库。这样我就可以根据它训练我的模型了。在

到目前为止，我参考了很多资料，但每一个都只是解释如何阅读你的标记语料库和阅读单词、句子等。下面是我尝试过的一段代码：

from nltk.corpus.reader import TaggedCorpusReader
reader = TaggedCorpusReader('/home/abc/nltk_data/', 'pos_tagged.pos')
reader.words()
reader.tagged_words()
reader.sents()

我想在home/nltk_data/corpora/文件夹中包含我的语料库，这样我就可以导入我创建的语料库。请引导我。在

Tags：标记 pos 模型 home data 单词 reader 句子

1条回答

网友

1楼 · 发布于 2024-06-09 22:31:01

我找到了解决方法：请参考link了解分步程序。在

从here下载相同的必要文件。在

一旦您遵循来自1的命令，将生成pickle文件，这是您的标记语料库。在

生成pickle文件后，您可以通过运行以下代码来检查标记器是否正常工作：

import nltk.data
tagger = nltk.data.load("taggers/NAME_OF_TAGGER.pickle")
tagger.tag(['some', 'words', 'in', 'a', 'sentence'])

相关问题更多 >

编程相关推荐

热门问题

热门文章