简单的尼泊尔选票
nepali-stemmer的Python项目详细描述
尼泊尔茎杆
这是一个简单的尼泊尔茎干。它迭代地分离后缀(后置位置),直到不能再处理分离。该算法基于印地语词干分析器。在
特点:
- 迭代分离
- 小心处理带有标点符号的后置
- 示例:नेपललाई,->;नेपपलाई
- 基本文本清理
- 尼泊尔语词典交叉验证
怎么跑
>>> from nepali_stemmer.stemmer import NepStemmer
>>> nepstem = NepStemmer()
>>> nepstem.stem("नेपालको एमाले पार्टीका झोले, मण्डलेहरु अमेरिका आउने रे !")
'नेपाल को एमाले पार्टी का झोले, मण्डले हरु अमेरिका आउने रे !'
待办事项:
- []词干转换过程
- []红外评估
- []代码混合数据
参考文献:
- 后缀列表:https://github.com/birat-bade/NepaliStemmer
- 尼泊尔语词典:https://github.com/PraveshKoirala/stemmer
- 算法:https://github.com/sainimohit23/hindi-stemmer
联系人
电子邮件:oyashi
注:项目创建期间,COVID-19隔离出于无聊和必要性
- 项目
标签: