信息检索用雪球词干算法

PyStemmer的Python项目详细描述


词干算法

pystemmer提供了对计算 词干词的词干形式这是一种最常见的 形态末端被移除;希望代表一个共同的 语言基础形式。这在构建搜索引擎时最有用 和信息检索软件;例如,使用词干 enabled应该能够找到包含“cycling”的文档 查询“周期”。

pystemmer为几种语言(主要是欧洲语言)提供了算法, 通过在python中包装snowball项目中的libstemmer库 模块。

它还为 中文:虽然这已经被一个改进的算法所取代,但是 原始算法可能对信息检索感兴趣 希望重现早期实验结果的研究人员。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java无法使用JAXB配置Moxy   java如何让我的简单Swing telnet客户端正确显示字符?   java中从可运行线程调用主线程的多线程处理   java数据源。EBJ3会话bean中的getConnection()   使用java和正则表达式从xml文件提取值时出现问题   java定制Jersy胡须Mvc   在Java中,“限制并发”是什么意思?   java有没有更干净的方法可以在这里使用Optional,而不在三个地方返回“NA”?   java Tomcat启动,然后崩溃,除非我打电话   java理解客户机和服务器   java时间戳将在视图对象>实体转换期间丢失   如何在java中返回布尔值(基元)?   java使用spring mvc设置日志记录,希望仅对我的代码进行跟踪/调试   用Jackson解析嵌套对象