我可以用nltk构建一个使用维基百科内容的问答引擎吗
我用PHP搭建了一个回答引擎,利用维基百科的内容。这个引擎会根据用户的提问,返回最相关的维基百科文章。不过大多数情况下,这个返回的结果并没有什么用。用户通常会用问句的形式提问,比如“韦恩·鲁尼的身高是多少”,我想直接给出鲁尼的确切身高,这个信息在他的维基百科文章里是有的。我能否通过使用nltk来解决这个问题?请给点建议。
1 个回答
3
总的来说:是的,这种程序是可以做的,但这是一项非常困难的任务。
你想要构建的东西叫做“语义搜索引擎”(可以查看一下维基百科),现在有很多研究在探索如何建立一个“语义网络”,以及如何从网页中提取信息,这样计算机就能回答你提到的问题,而不仅仅是提供相关文档的链接。不过,目前的结果还远远不够完美。
比较好的语义搜索引擎之一是trueknowledge,当然还有之前提到的wolframalpha(它在科学方面表现得很好)。
如果你真的想要构建这样的语义搜索引擎,nltk可能会提供一些有用的基础工具,但不要指望这会是一件简单的事情。