多语言文档语言识别

seqtolang的Python项目详细描述


塞克托朗

PyPI pyversionsCircleCI

seqtolang是一个用于识别多语言文档的python库。在

有关实现的详细信息,请参见this帖子。在

入门

从源安装:

$ git clone https://github.com/hiredscorelabs/seqtolang
$ cd seqtolang
$ python setup.py install

或者使用PyPi:

^{pr2}$

基本用法:

fromseqtolangimportDetectordetector=Detector()text="In Chinese, the French phrase 'Je rentre chez moi Je rentre chez moi' will be '我正在回家'"languages=detector.detect(text)print(languages)>>>[('fr',0.499),('en',0.437),('zh',0.062)]tokens=detector.detect(text,aggregated=False)print(tokens)>>>['eng','eng','eng','eng','eng','fra','fra','fra','fra','fra','fra','fra','fra','eng','eng','zho']

seqtolang支持36种语言:

['afr', 'eus', 'bel', 'ben', 'bul', 'cat', 'zho', 'ces', 'dan', 'nld', 'eng', 'est', 'fin', 'fra', 
'glg', 'deu', 'ell', 'hin', 'hun', 'isl', 'ind', 'gle', 'ita', 'jpn', 'kor', 'lat', 'lit', 'pol', 
'por', 'ron', 'rus', 'slk', 'spa', 'swe', 'ukr', 'vie']

支持

寻求帮助

您可以在Github Issues上提问并加入开发讨论

许可证

Apache许可证2.0

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java PUT请求提供415不支持的媒体类型   JavaMockito:如何在不模拟所有参数的情况下轻松地存根一个方法   java如何将NameValuePair传递给安卓中的另一个活动?   servalet java中的tomcat错误   java Android手机无法连接到eclipse   nullpointerexception在Java中如何将null转换为false?   Java中的http代理身份验证   java如何确保最新版本的JAR与JNLP应用程序一起使用?   简单Java代码上的性能大内存占用   列出AWS EC2实例上运行的服务上的对象时,java 403访问被拒绝   java创建一个类,当创建一个新实例时,它会被添加到一个hasmap中   LookupService中的java getLocation方法返回null   java获取要在ListView中显示的ArrayList字符串编号/位置