用python编写的基于规则的孟加拉语词干分析器

py-bangla-stemmer的Python项目详细描述


#基于规则的孟加拉语词干分析器

安装
pip安装py_bangla_词干分析器
用法

从py_bangla_stemmer导入banglastemmer

词干分析器=banglastemmer() 茎干器.茎 茎干器.茎('2488;__')'2488;_'

##规则文档 ####x+n: 当x出现在单词的末尾并且单词长度至少为n时,将其删除 ####y->;z+n: 当y出现在单词的末尾并且单词长度至少为n时,将其替换为z ####y.z->;a.b+n: 当y,后跟某个字符a,后跟z出现在单词的末尾时 单词长度至少为n,替换为aab

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在Spring Boot 2.2.0中添加弹性搜索?   jakarta ee如何在没有java认证的情况下停止直接访问网页(自定义标记)   java Hibernate:使用executeUpdate()的批删除未清除一级缓存   java如何在Hibernate中插入外键定义为Long的实体?   带参数的java Mockito单元测试计算器方法   java如何从Rally Rest API读取集合属性   java如何对基于消息的处理执行集成测试?   带插入排序的java排序字符串数组标记,双链表   java为什么在基于注释的Spring app@Value默认值中解析为null?   java Apache Commons Http客户端注册特定于客户端的协议   如何使用java反转字符串中n个部分的n个字符   java Tomcat在本地主机上运行良好,但在部署时出现内部服务器错误   使用信号量的变量的java结果   Java编译/运行时类路径问题   java哪个提供商负责AES/CTR/NOP添加?   伪错误解码器中的java响应未获取Zalando问题自定义属性