Python brill_专题 - Python中文网

如何在Brill tagger，NLTK中修改规则

nltk中的brill标记器在标记指令数据时出错。例如：“加热至棕色”，将被标记为“[[（'heat'，'NN'），（'until'，'IN'），（'brown'，'JJ'）]]”。指令数据集中的大多 ...

2024-05-15 已阅读: n次

我试图基于https://www.clips.uantwerpen.be/pages/using-wikicorpus-nltk-to-build-a-spanish-part-of-speech-t ...

2024-05-15 已阅读: n次

当我试着训练一个有4万个句子的语料库时，没有问题。但当我训练86K个句子时，我会出现这样的错误： ERROR:root: Traceback (most recent call last): Fi ...

2024-05-15 已阅读: n次

最近，我正在读一本书《用Python进行自然语言处理》。在第5.6节基于转换的标记，代码print(open("errors.out").read())不起作用，并给出以下错误信息： Tracebac ...

2024-05-15 已阅读: n次

我试图通过使用NLTK's brill module来训练一个特定的chunker（为了简单起见，让我们说一个名词chunker）。我想用三个功能，即word，POS标签，IOB标签。在 (Rams ...

2024-05-15 已阅读: n次

我有一个训练有素的NLTK标记器（Brill的基于规则的转换标记器）。我想把它用在GAE上。最好的办法是什么？在 ...

2024-05-15 已阅读: n次

我已经编写了一个Python代码来训练NLTK库中的Brill Tagger处理大约8000个英语句子和标记大约2000个句子。你知道吗 Brill Tagger需要花费很多很多小时来训练，最后当它完 ...

2024-05-15 已阅读: n次

我正在使用NLTK中提供的py crfsuite培训Brill的POS tagger。但是，当我试图保存一个经过训练的模型时，我得到了以下错误 crf_tagger = CRFTagger() ...

2024-05-15 已阅读: n次

我已经阅读了CSV文件（包含客户的姓名和地址），并将数据分配到DataFrame表中。你知道吗 csv文件（或DataFrame表）的描述 DataFrame包含几行和7列数据库示例 Client_ ...

2024-05-15 已阅读: n次

我已经读了一个CSV文件（有客户地址），并将数据分配到DataFrame表中。在 csv文件（或DataFrame表）的说明 DataFrame包含多行和5列数据库示例 Address1 ...

2024-05-15 已阅读: n次

我想用NLTK的Brill标签标记一些文本。但是，脚本的退出方式如下： $ ./brill.py Training Brill tagger on 43005 sentences... Finding ...

2024-05-15 已阅读: n次

当我尝试导入时 from nltk.tag.brill import SymmetricProximateTokensTemplate, ProximateTokensTemplate fr ...

2024-05-15 已阅读: n次