有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java NLP确定一段文本是否在谈论给定的主题?

我有一个Java应用程序,我希望在其中实时确定给定的文本是否在谈论作为查询提供的主题

我研究过的一些技术是使用opennlp和Stanford-nlp-coref-detection等包进行的协同引用检测,但这些模型的加载时间非常长,在生产应用程序环境中似乎不实用。是否有可能执行共指分析,以便给定一段文本和一个主题,我可以得到该文本正在讨论该主题的布尔答案

除了需要经过训练的语料库的文档分类之外,还有其他技术可以帮助我实现这样的目标吗


共 (2) 个答案

  1. # 1 楼答案

    我建议你看看Weka。它是用Java编写的,因此可以很好地与您的环境结合,能够更快地满足您的需求,有很多工具,并带有UI和API。如果您正在研究无监督方法(即不使用预分类语料库进行任何学习的方法),这里有一篇有趣的文章:http://www.newdesign.aclweb.org/anthology/C/C00/C00-1066.pdf

    你也可以在谷歌上搜索“无监督文本分类/信息检索”。你会得到很多方法。你可以选择一个你觉得最容易的

  2. # 2 楼答案

    对于每个主题(如果它们是预定义的),您可以创建术语列表,并为每个句子检查句子和每个主题列表的余弦相似性,并向用户显示最接近的主题