如何在Python中使用textcat?

2024-04-23 09:20:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我想试试看。如果能从Python运行它对我来说是最方便的,因为我想看看它在私有数据集上的表现如何。在

我给了languagedet,但是根据

from languagedet.mixed import MixedDetector
det = MixedDetector()
print(det.available)

相比TextCats网站上宣称的69种语言,可以通过languagedet获得的要少得多。在

我也尝试了pylibtextcat,但我得到:

^{pr2}$

当我试图安装它时(我已经安装了libexttextcat-2.0-0libexttextcat-datalibexttextcat-dev)。在

我可以在Python中使用TextCat吗?在


Tags: 数据fromimport语言网站available集上print
1条回答
网友
1楼 · 发布于 2024-04-23 09:20:05

似乎不一样,但nltk有:

from nltk.classify import textcat

text = "This is a simple example."
cls = textcat.TextCat()

distances = cls.lang_dists(text)  # a dict of 437 elements
cls.guess_language(text)  # a str

相关问题 更多 >