有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java如何最好地检测无意义的文本?

我的用例是我有传入的文件。一些具有描述性文件名,而另一些具有文件名的数字和/或字母集合

我想知道,当文件名不是英文单词时,什么是合适的检测方法

有没有文本挖掘范例可以完成这样的任务

谢谢


共 (1) 个答案

  1. # 1 楼答案

    你需要有一个英语单词的查找表,当你检查表中的输入单词时。对于这棵树,您可以使用:

    https://code.google.com/p/word2vec/

    你只需要使用单词表就可以了。表中的任何内容都是有效的单词