泰语自然语言处理库

pythainlp的Python项目详细描述


PyThaiNLP Logo

毕达因

pythainlp是一个用于泰语自然语言处理(nlp)的python库。

pythainlp包括泰语单词标记器、音译器、soundex转换器、部分语音标记器和拼写检查器。

在Facebook上关注我们PyThaiNLP

2.0有什么新功能?

安装

对于稳定版本:

pip install pythainlp

对于某些高级功能,如word vector,可能需要额外的包。在PIP安装期间,使用以下选项安装它们:

pip install pythainlp[extra1,extra2,...]

可提供额外服务的地方

  • artagger(支持artagger词性标记)*
  • deepcut(支持Deepcut机器学习的标记器)
  • icu(用于ICU在音译和标记化方面的支持)
  • ipa(用于音译中的国际音标支持)
  • ml(支持FastAI 1.0.22 ULMFIT机型)
  • ner(用于命名实体识别器)
  • thai2fit(泰语单词向量)
  • thai2rom(用于机器学习的罗马化)
  • full(安装所有组件)

note for windowsmarisa-trie可以从https://www.lfd.uci.edu/~gohlke/pythonlibs/#marisa-trie获得轮子 用pip安装,例如:pip install marisa_trie‑0.7.5‑cp36‑cp36m‑win32.whl

链接

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java Websocket在对同一socket发出下一个请求之前等待响应   java对图像CameraPreview图像提要应用过滤器   java Appium如何在iOS设备上设置地理位置?   java无法通过报表中的超链接发送请求参数   java Spring@ConfigurationProperties解析器忽略外部化属性   java如何调用nvcc打开。cu文件没有委托给其他编译器?   java当javadoc未附加到依赖项时,如何在Maven的eclipse插件中将javadoc引用到依赖项   java如何禁用Hibernate的集合缓存   java字符串反向操作最佳时间复杂度:是O(n)还是O(n/2)?   java无法读取InputStream   java如何关闭被锁定在无限循环中的socket?   asynctask刷新后尝试访问适配器时出现java nullPointer异常   SwingJava:等待输入并在JFrames之间传输信息   java我不理解这个ThreadPoolExecutor行为   java使用JOOQ,如何将SQLException映射到业务异常?   java“无法将IntentReceiver解析为类型”。为什么?   在Eclipse中运行RSE java项目   筛选如何将映射添加到Java流的foreach中   JTabbedPane的java MouseeEvent   java面向对象语言和非面向对象语言之间有什么区别?