荷兰语的NLTK命名实体识别

2024-05-29 04:54:55 发布

男 | 程序猿一只，喜欢编程写python代码。

我试图从荷兰语文本中提取命名实体。我用nltk-trainer在2002年的荷兰语料库上训练了一个标记器和一个切块器。但是，来自chunker的parse方法没有检测到任何命名实体。这是我的代码：

str = 'Christiane heeft een lam.'

tagger = nltk.data.load('taggers/dutch.pickle')
chunker = nltk.data.load('chunkers/dutch.pickle')

str_tags = tagger.tag(nltk.word_tokenize(str))
print str_tags

str_chunks = chunker.parse(str_tags)
print str_chunks

这个程序的输出是：

[('Christiane', u'N'), ('heeft', u'V'), ('een', u'Art'), ('lam', u'Adj'), ('.', u'Punc')]
(S Christiane/N heeft/V een/Art lam/Adj ./Punc)

我原以为克里斯蒂娜会被发现是一个有名字的实体。有什么帮助吗？

Tags：实体 data parse tags load 命名 tagger nltk

0条回答

目前没有回答

荷兰语的NLTK命名实体识别

相关问题更多 >

编程相关推荐

热门问题

热门文章

荷兰语的NLTK命名实体识别

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >