我在寻找后缀树实现,它具有这个友好的API,模仿python字典:
import SubstringDict
d = SubstringDict.SubstringDict()
d['foobar'] = 1
d['barfoo'] = 2
d['forget'] = 3
d['arfbag'] = 4
d['a']
>>> [1, 2, 4]
d['arf']
>>> [2, 4]
d['oo']
>>> [1, 2]
d['food']
>>> []
我从这个网站上取了这个例子:Suffix Trees in Python 您可能会问:“为什么不使用网站上的实现?” 显然,它在python绑定中有一些内存泄漏,所以我不能将它用于我的大型(120万个字符串,大约200 MB)数据集。在
我会很高兴用C++实现(我可以自己编写Python绑定),用下面的API:
^{pr2}$有什么提示吗?在
目前没有回答
相关问题 更多 >
编程相关推荐