NLTK/NLP建立多个/多标签主题分类我有5000多个XML主题索引文档的人类标记语料库。它们的大小从几百千字节到几百兆字节不等。作为手稿的短文。它们都被编入了和段落级别一样深的索引。我很幸运有这样一个语料库,我正试图教自己一些NLP的概 ...2024-04-25 已阅读: n次
annif安宁 ANNIF是一个自动主题索引工具包。它最初创建为 一种使用来自元数据的统计自动索引工具 Finna.fi作为训练语料库的发现接口。 此回购协议包含基于 prototype。这 ...2024-04-25 已阅读: n次