泰语自然语言处理库

pythainlp的Python项目详细描述


PyThaiNLP Logo

毕达因

pythainlp是一个用于泰语自然语言处理(nlp)的python库。

pythainlp包括泰语单词标记器、音译器、soundex转换器、部分语音标记器和拼写检查器。

在Facebook上关注我们PyThaiNLP

2.0有什么新功能?

安装

对于稳定版本:

pip install pythainlp

对于某些高级功能,如word vector,可能需要额外的包。在PIP安装期间,使用以下选项安装它们:

pip install pythainlp[extra1,extra2,...]

可提供额外服务的地方

  • artagger(支持artagger词性标记)*
  • deepcut(支持Deepcut机器学习的标记器)
  • icu(用于ICU在音译和标记化方面的支持)
  • ipa(用于音译中的国际音标支持)
  • ml(支持FastAI 1.0.22 ULMFIT机型)
  • ner(用于命名实体识别器)
  • thai2fit(泰语单词向量)
  • thai2rom(用于机器学习的罗马化)
  • full(安装所有组件)

note for windowsmarisa-trie可以从https://www.lfd.uci.edu/~gohlke/pythonlibs/#marisa-trie获得轮子 用pip安装,例如:pip install marisa_trie‑0.7.5‑cp36‑cp36m‑win32.whl

链接

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
datetime如何使用JodaTime在Java中设置时间属性   java固定算法的性能时间   java如何从JMenu中获取所选项以更改文本区域的文本颜色?   java配置单元UDF传递数组<string>作为参数   javaapachebeam和BigQuery   java与PrintWriter之间的差异。printf和PrintWriter。格式方法   继承如何处理按Java版本更改的导入,以及在多个版本上编译   xml java。lang.noClassDefFoundant生成错误   java如何使用包含映射的JSON发送POST请求?   java如何在任何应用程序的JAR文件中绑定MySql数据库?   Java脚本解释器   sslhttpclientjava。网SocketException:未实现未连接的socket   java如何为Android应用程序创建类似于Cron作业的东西   java JButton+radiobox+复选框   java内存管理将文件写入内存   java这是计算对象实例的有效方法吗?   用于死锁情况的java代码?   JavaSpring容器作为新实体插入,而不是存储在表中