有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java如何在Textpad中使用Html解析器?

我并不是Java的新手,我在大学时学过Java。我目前正在做一个从网上网页抓取数据的小程序。我做了谷歌搜索,发现html解析器是一种简单的方法

我的问题是如何设置类路径,并在TextPad中导入html解析器库

----我的回答-----------------------------------------------

我找到了解决这个问题的方法。我想我应该把它发到这里,以防别人和我有同样的问题

我不知道这是不是解决这个问题的合适方法。给你

我找到了一个链接 http://htmlparser.sourceforge.net/javadoc/doc-files/using.html

我下载了HTMLPasser zip文件,并将lib文件夹解压到我的c驱动器上。 我在CMD中运行这一行。(我使用的是基于windows的系统。) 设置CLASSPATH=C:\lib\htmlparser。罐子C:\lib\htmlexer。罐子;%类路径% 那就行了

我猜这句话是给你添新的。jar文件到旧的类路径。%CLASSPATH%表示您的旧类路径


共 (1) 个答案

  1. # 1 楼答案

    我做了大量的屏幕清理,发现Java太麻烦了。根据我的经验,我宁愿使用Groovy来筛选数据。你不需要去摆弄讨厌的类路径。由于groovy是一个面向Java的dsl,而且您知道Java,所以它将非常简单。您还可以使用Textpad作为编辑器

    例如:

    def slurper = new XmlSlurper()
    def htmlParser = slurper.parse("http://stackoverflow.com")
    
    htmlParser.'**'.findAll{ it.@class == 'question-hyperlink'}.each {
       println it
    }
    

    以上代码来自一篇博文:http://www.maclovin.de/2010/02/robust-html-parsing-the-groovy-way/