BM25搜索算法在python中的实现

2024-05-15 23:51:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在用python设计一个基于okapi bm25的搜索引擎,我应该使用什么来存储页面数据(相关性等)和tf、idf以实现快速访问?python shelf对于可伸缩的设计来说足够好吗?在

谢谢。在


Tags: 数据tf页面快速访问搜索引擎okapishelfbm25
1条回答
网友
1楼 · 发布于 2024-05-15 23:51:03

我建议您看看wiredtiger它是一个功能强大的keyvalue存储,它比leveldb或bsddb(shelf模块使用bsddb)更快地构建存储。它们是不同的模式,你可以在stackoverflow中查找有关leveldb或bsddb的问题。在

如果您不熟悉键/值存储,我建议您将leveldbplyvel一起使用,这是一个很好的开始,但不能像wiredtiger那样伸缩。在

相关问题 更多 >