简单的尼泊尔选票

nepali-stemmer的Python项目详细描述


尼泊尔茎杆

这是一个简单的尼泊尔茎干。它迭代地分离后缀(后置位置),直到不能再处理分离。该算法基于印地语词干分析器。在

特点:

  • 迭代分离
  • 小心处理带有标点符号的后置
    • 示例:नेपललाई,->;नेपपलाई
  • 基本文本清理
  • 尼泊尔语词典交叉验证

怎么跑

>>> from nepali_stemmer.stemmer import NepStemmer
>>> nepstem = NepStemmer()
>>> nepstem.stem("नेपालको एमाले पार्टीका झोले, मण्डलेहरु अमेरिका आउने रे !")                                                                                                      

'नेपाल को एमाले पार्टी का झोले, मण्डले हरु अमेरिका आउने रे !'

待办事项:

  • []词干转换过程
  • []红外评估
  • []代码混合数据

参考文献:

联系人

电子邮件:oyashi

注:项目创建期间,COVID-19隔离出于无聊和必要性

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java是否存在这样一种场景:Java7的Hashmap实现优于Java8的实现   java如何打印这些完整的数组?   java BuildException:未能执行aapt   java如何使用类。未知类型的集合返回的cast()   java准备语句返回错误的值   webview 安卓中的java显示身份验证对话框   java如何重命名列名JPA Hibernate   java查询从特定用户和特定时间段的Oracle表(通过比较原始表和备份表)中选择修改的行   java Youtube视频仅在三星S6设备上加载时自动暂停   未调用java RecyclerView getItemViewType   使用JSch setCommand执行带有源选项的java Shell ping命令时失败   java Hibernate:无法删除|删除分离的实例   Java Spring@MappedSuperclass字段作为子类中的@Id字段   java Android:确定单击了哪个按钮,因为该按钮未在xml中定义   如何计算java阵列内存使用率   使用Java查找按字母顺序排列的第一个字符串   javascript注销功能刷新页面,但页面仍已登录   当接口作为参数提供时,java依赖项注入不起作用   java中带原语的字符串扭曲