寻找Python或网页服务的语言识别库
有没有什么工具可以识别语言的功能呢?
比如说,如果我输入一句英语,它能告诉我这句话可能是英语。
我觉得我需要以下其中一种东西。
- 一个可以识别语言的Python库。
- 一个提供这种功能的网络服务。
有人能帮忙吗?
2 个回答
1
你试过 nltk 吗?可以看看 这个StackOverflow的问题,里面有更多信息。
还有一个来自 施乐(xerox)的网络服务,他们声称可以满足你的需求。
2
我使用过GuessLanguage这个模块,使用得挺多的。它可以识别100多种语言,对于长篇的文本效果很好。英语的识别效果非常不错。其他语言的效果我就不太确定了。如果你想处理短句子或者推特内容,它的表现就不太好了,因为它是为了识别完整文章而设计的。
我所在的公司(社交媒体分析)目前也在寻找替代的工具,正在考虑NLTK作为一个选项。