如何在NLTK中使用西班牙Wordnet?
我刚刚从项目GRIAL下载了一个西班牙语的Wordnet,格式是XML。请问我该如何在Python的NLTK中使用它呢?
除此之外,在同一页面上你还可以下载一个带标签的西班牙语语料库。我该如何把它也加入进来呢?
1 个回答
3
使用XMLCorpusReader来加载XML数据作为语料库
下面是实现这个功能的代码
from nltk.corpus.reader import XMLCorpusReader
reader = XMLCorpusReader(dir, file)
这里有一个完整的示例,展示了如何使用XMLCorpusReader,具体内容可以在这里找到