java如何使用lucene计算单词支持度和可信度
我想在Java应用程序中使用Lucene来计算单词支持度和置信度。 我有500多个。txt文档,ArrayList包含两个术语,术语i和术语j
The formula for counting Confidence
Dti-tj/Dti
Dti-tj: Total document contains term i,term j
Dti : Total document contains term i
The formula for counting Support
Dti-tj/D
Dti-tj = Total document contains term i,term j
D = Total Document in the collection
是否可以使用Lucene搜索和计算单词? 我要上什么课
# 1 楼答案
我只需搜索您的两个术语,term
i
和termj
,并从搜索返回的totalHits
中获取您的计数