拉脱维亚轻茎。
LatvianStemmer的Python项目详细描述
原始Java代码可以在https://github.com/apache/lucene-solr
由rihards kri_lauks移植到python,稍加修改
拉脱维亚语的轻型词干分析器。
这是karlis kreslin博士论文a词干算法中的一个简单版本,该算法针对拉脱维亚语进行了以下修改:
- 仅显式词干名词和形容词词法
- 对产生的词干进行更严格的长度/元音检查(删除动词等后缀剥离)
- 只删除主要屈折后缀:名词的大小写和数字;形容词的大小写、数字、性别和确定性。
- 只有当词尾ii,v,vi名词后缀被移除时,味觉化才被处理。