拉脱维亚轻茎。

LatvianStemmer的Python项目详细描述


原始Java代码可以在https://github.com/apache/lucene-solr

由rihards kri_lauks移植到python,稍加修改

拉脱维亚语的轻型词干分析器。

这是karlis kreslin博士论文a词干算法中的一个简单版本,该算法针对拉脱维亚语进行了以下修改:

  • 仅显式词干名词和形容词词法
  • 对产生的词干进行更严格的长度/元音检查(删除动词等后缀剥离)
  • 只删除主要屈折后缀:名词的大小写和数字;形容词的大小写、数字、性别和确定性。
  • 只有当词尾ii,v,vi名词后缀被移除时,味觉化才被处理。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JavaCenter是JavaFX2中不可执行的窗格   java Docker将容器连接到本地数据库   java无法通过Spring从Redis获得正确的值   java为什么要将数组转换为列表再转换为数组   Java泛型在方法中放入字符串或整数参数   在Cloud Bigtable SDK中找不到java类   java Mavensiteplugin无法加载生成的源(Jaxb)   java GWT序列化和Appengine通道Api   PrintWriter out=new PrintWriter(sWriter)和PrintWriter out=response之间的java差异。getWriter()   空手道DSL中的javascript,在java参数调用中传递变量时如何转义单引号   windows 64位java可以与32位tomcat一起使用   为for循环| Java输入参数   java您可以更改SWT选项卡项的背景和/或前景颜色吗?   用java生成6位pin码   java如何从另一个通量中排除通量中的所有元素   java无法调用“javafx.scene.control.ComboBox.getItems()”,因为“Controller.getMyBox()”的返回值为null   将Java字符串与数组匹配时出现问题   java如何使用HttpsUrlConnection对SSL连接使用代理身份验证?   java如何检查XML元素是否包含CDATA?