如何在Brill tagger,NLTK中修改规则nltk中的brill标记器在标记指令数据时出错。例如:“加热至棕色”,将被标记为“[[('heat','NN'),('until','IN'),('brown','JJ')]]”。指令数据集中的大多 ...2024-04-29 已阅读: n次
NLTK-Brills方法从版本2到3.5的等价性我试图基于https://www.clips.uantwerpen.be/pages/using-wikicorpus-nltk-to-build-a-spanish-part-of-speech-t ...2024-04-29 已阅读: n次
在Python中训练TBL POS Tagger时出现内存错误当我试着训练一个有4万个句子的语料库时,没有问题。但当我训练86K个句子时,我会出现这样的错误: ERROR:root: Traceback (most recent call last): Fi ...2024-04-29 已阅读: n次
NLTK Brill demo不产生错误.out最近,我正在读一本书《用Python进行自然语言处理》。在第5.6节基于转换的标记,代码print(open("errors.out").read())不起作用,并给出以下错误信息: Tracebac ...2024-04-29 已阅读: n次
训练IOB Chunker使用训练器(转型学习)我试图通过使用NLTK's brill module来训练一个特定的chunker(为了简单起见,让我们说一个名词chunker)。我想用三个功能,即word,POS标签,IOB标签。在 (Rams ...2024-04-29 已阅读: n次
Python:如何加载和使用经过训练和酸洗的NLTK标记器来GAE?我有一个训练有素的NLTK标记器(Brill的基于规则的转换标记器)。 我想把它用在GAE上。最好的办法是什么?在 ...2024-04-29 已阅读: n次
有没有可能只修改和运行Python程序的一部分,而不必一次又一次地运行所有的Python程序?我已经编写了一个Python代码来训练NLTK库中的Brill Tagger处理大约8000个英语句子和标记大约2000个句子。你知道吗 Brill Tagger需要花费很多很多小时来训练,最后当它完 ...2024-04-29 已阅读: n次
NLTK保存训练有素的布里尔的国防部我正在使用NLTK中提供的py crfsuite培训Brill的POS tagger。但是,当我试图保存一个经过训练的模型时,我得到了以下错误 crf_tagger = CRFTagger() ...2024-04-29 已阅读: n次
如果特定列中存在重复值,则删除整行我已经阅读了CSV文件(包含客户的姓名和地址),并将数据分配到DataFrame表中。你知道吗 csv文件(或DataFrame表)的描述 DataFrame包含几行和7列 数据库示例 Client_ ...2024-04-29 已阅读: n次
将物理地址转换为地理位置纬度和经度我已经读了一个CSV文件(有客户地址),并将数据分配到DataFrame表中。在 csv文件(或DataFrame表)的说明 DataFrame包含多行和5列 数据库示例 Address1 ...2024-04-29 已阅读: n次
NLTK Brillitagger在2.5小时后退出,退出代码为137。怎么了?我想用NLTK的Brill标签标记一些文本。但是,脚本的退出方式如下: $ ./brill.py Training Brill tagger on 43005 sentences... Finding ...2024-04-29 已阅读: n次
Python NLTK Brill Tagger没有SymmetricProximateTokensTemplate、ProximateTokensTemplate、ProximateTagsRule、ProximateWordsRule当我尝试导入时 from nltk.tag.brill import SymmetricProximateTokensTemplate, ProximateTokensTemplate fr ...2024-04-29 已阅读: n次