我想找一种方法来计算搜索引擎的MRR。 我知道倒数排名的计算方法如下:
RR=1/第一个相关结果的位置
但当我知道哪一个是我的查询词(我的意思是“问题”)时,这就起作用了! 在我的情况下,我只有结果: . . . 在
我有以下可用的数据格式: 查询n.1的正确结果: GT=[doc1,doc2,doc3] 我的搜索引擎对查询n.1的结果: SE=[doc2,doc7,doc1]
在这种情况下,我应该如何计算RR? 到目前为止,我的做法是:
all_rr=[]
for i in queries:
for j in queries_results:
pos=j.index(i[0])+1
RR=1/pos
all_rr.append(RR)
MRR=np.mean(all_rr)
这是正确的方法吗? (p.s.queries是my GT的数据帧,queries_result是my SE results数据帧)
如果你能负担得起你的结果和基本事实:
相关问题 更多 >
编程相关推荐