用python编写的基于规则的孟加拉语词干分析器
py-bangla-stemmer的Python项目详细描述
#基于规则的孟加拉语词干分析器
- 安装
- pip安装py_bangla_词干分析器
- 用法
从py_bangla_stemmer导入banglastemmer
词干分析器=banglastemmer() 茎干器.茎 茎干器.茎('2488;__')'2488;_'
##规则文档 ####x+n: 当x出现在单词的末尾并且单词长度至少为n时,将其删除 ####y->;z+n: 当y出现在单词的末尾并且单词长度至少为n时,将其替换为z ####y.z->;a.b+n: 当y,后跟某个字符a,后跟z出现在单词的末尾时 单词长度至少为n,替换为aab