java如何使用Lucene构建我自己的“常用词”过滤器
我知道Lucene使用一个停止字(通用)过滤器进行搜索,我还知道对于这项工作,标准分析器或英语分析器负责。如果我想将自己的常用词添加到analyzer过滤器中,该怎么办?我如何添加诸如计算机、互联网、系统等词
你可以在下面搜索框中键入要查询的问题!
我知道Lucene使用一个停止字(通用)过滤器进行搜索,我还知道对于这项工作,标准分析器或英语分析器负责。如果我想将自己的常用词添加到analyzer过滤器中,该怎么办?我如何添加诸如计算机、互联网、系统等词
# 1 楼答案
我想“常用词”是指停止词
为了添加到标准列表中,只需使用另一个
StandardAnalyzer
构造函数(它接受stopwords作为CharArraySet
或Reader
)。要获取标准停止字集,请使用StopAnalyzer.STOP_WORDS_SET