有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java神经网络用于查找特定类型的网站?

所以我正在做我的第一个项目,我试图以某种方式将神经网络融入其中。目前,我刚刚创建了一个网络爬虫,它基本上以一个单词作为输入,然后执行谷歌搜索并检索链接的html数据

现在我试图只使用特定类型网站的html数据,在我的例子中,这些网站提供免费的教育内容/课程。例如,此站点https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-092-java-preparation-for-6-170-january-iap-2006/index.htm 我对神经网络还不熟悉,但这是神经网络能够做到的还是另一种方法更好

另外,我的其余代码,比如web crawler,都是Java语言,所以如果神经网络在这种情况下适用,你们会推荐什么库或工具来构建/训练神经网络。我在想欧米诺,但很想听听一些建议


共 (1) 个答案

  1. # 1 楼答案

    当你使用神经网络时,它是用来预测某些东西的,例如,你得到一幅图像作为输入,作为输出,你必须得到图像的性质,例如,知道图像的内容是什么:是猫还是狗。。etc

    • 关于网络爬虫:

    你一直在谈论的网络爬虫不一定需要神经网络(你想要的想法),但如果你想添加一些预测,那么你可以使用它,例如,将单词作为输入,在谷歌上搜索,然后预测内容的性质

    我不知道你想要预测什么或者你想要预测的性质(分类或回归),但是我可以首先建议你如何输入html


    • 将Html内容作为输入:

    首先要提到的是,神经网络不处理字符,它处理数字,所以如果你想处理html内容,你必须使用mecanism,这不是一个简单的步骤,有一个领域叫做NLP(自然语言处理),它提供了一些处理文本的好方法,您还可以将其用于html内容(如果需要,也可以采用其他方式)

    我之前已经做过一个关于文本建议的项目,其中我使用了NLP的一种方法,你可以在我的github上检查它,因为我在自述上详细解释了所有步骤:https://github.com/KaramMed/Modele-de-Suggestion-du-Texte

    • 关于库:

    我建议您使用TensorFlowfor Java,它是最好的深度学习库之一,您可以找到很多关于它的教程