如果两个单词的变体按字母顺序不匹配,则相互匹配我正在和我的大学一起做一个NLP项目,收集冰岛语单词的数据,这些单词的拼写都是I和y(冰岛语中的发音是一样的,仅供参考),其中的变体都是实际单词,但意思并不相同。这方面的例子包括leyti(时间上的近 ...2024-05-24 已阅读: n次
reynir 概述 reynir是用于 将冰岛文本解析成句子树(即full 选区解析树)。这些树可以用来提取 来自文本的信息,例如关于人、头衔、实体的信息, 事实、行动和意见。 一路上,reynir标记文本, ...2024-05-24 已阅读: n次
tokenizer 概述 标记化是许多自然语言处理过程中必不可少的第一步。 任务,如单词计数、语法分析、拼写检查、语料库生成和 文本的统计分析。 标记化器是一个用于标记化的紧凑的 ...2024-05-24 已阅读: n次
reynir-correct 概述 reynircorrect是用于 检查并更正冰岛文本中的拼写和语法。 reynircorrect使用Reynir包, 由相同的作者来标记和解析文本。 令牌级别校正 reynircorrect ...2024-05-24 已阅读: n次