基于韩国语rpc的语言处理应用

korhal的Python项目详细描述


科哈尔

GitHub tag (latest SemVer)PyPITravis (.com) branchCodacy branch grade

korhal(基于韩国语rpc的语言处理便捷应用程序)是一个用于多个韩国语部分语音标记的python包装器。

如何安装

pip install korhal

可用的标记符

  • korhal.komoran
  • 的komoran
  • korhal.hannanum
  • 的hannanum
  • 带有korhal.openkoreantext
  • 的开源韩文文本处理器

如何使用

fromkorhal.komoranimporttokenizeresult=tokenize("집에 가서 잠을 자고 싶다")# result => Token(text=집,pos=NNG), Token(text=에,pos=JKB), Token(text=가,pos=VV), Token(text=아서,pos=EC), Token(text=잠,pos=NNG), Token(text=을,pos=JKO), Token(text=자,pos=VV), Token(text=고,pos=EC), Token(text=싶,pos=VX), Token(text=다,pos=EC)]print(result.text)# => 집print(result.pos)# => NNGnouns=[token.textfortokeninresultiftoken.pos.startswith('N')]

异步方法

使用korhal.aio,可以使用异步方法。在执行扩展处理时,多核系统的性能可以稍微提高。

fromkorhal.aio.opentextkoreanimporttokenizetexts=['달디단 맛있는 케이크가 있었다','솜사탕 같이 귀여운 구름']futures=[tokenize(text)fortextintexts]results=[f.result()forfinfutures]

感谢

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java从服务器中的jsp页面读取参数   java构造函数会话(字符串,int)不可见   在java中计算特定字符,但我的程序只读取单词中的第一个字符   在java中转换为json的Hashmap的Hashmap。当发送到jsp时,我用javascript解析它。但它在javascript中的解析不正确   JavaSpringDataREST并没有保存实体的所有字段   java如何通过inten共享图像   eclipse是Java所需要的。即使已定义,也要运行的类文件   rest MapStruct Java流   java在OpenJDK 11的源代码上运行DocumentationTool   比较两个ArrayList索引时的java IndexOutOfBoundsException   java为什么Spring验证器需要将错误对象传递给应用程序(富客户端)并由其处理?   java Android从sms垃圾邮件文件夹或列表中检索垃圾邮件号码   java从匿名类参数访问类的实例   java MethodHandle与通用非类返回筛选器?   指定队列顺序的java