Python中的语义搜索:爱好与最新新闻
我想用Python来实现一个语义搜索,主要是针对一些关键词,比如人们可能感兴趣的话题,比如爱好、最新新闻等等。我想知道有没有相关的本体数据库,以及开源的搜索算法或实现方法。
比如,我的关键词集合是:{聊天、喝酒、发推特、卡特里娜·凯夫、卡特里娜飓风、收集岩石、收集硬币}。
所以,当我搜索“积累”这个词时,可能会得到“收集岩石”和“收集硬币”作为结果。
补充说明:这些词组可以包含多个单词。例如,“美国总统巴拉克·奥巴马”也是一个有效的查询。
2 个回答
1
4
你可能想试试“随机索引”。这个方法正好能满足你的需求,它会为每个单词计算一个特征向量,并定义两个单词之间的语义相似度。
你只需要下载一份《随机索引简介》,还有一个semanticvectors的工具包,就可以开始了……
希望这些对你有帮助,如果你需要更多建议,欢迎留言……