java为安卓应用程序刮取HTML的最佳方法是什么?
从网页中删除以下HTML的最佳方法是什么?我想把苹果、橘子和葡萄放到Android应用程序的下拉菜单中。我应该使用Jsoup来实现这一点吗?如果是,最好的方法是什么?我应该改用正则表达式吗
<select name="fruit" id="fruit" >
<option value="APPLE">Apple</option>
<option value="ORANGE">Orange</option>
<option value="GRAPE">Grape</option>
</select>
# 1 楼答案
视情况而定,但我会使用XML/HTML解析器Don't use regex
以jsoup为例:
More on jsoup selector syntax
最好的办法
我会选择内置的DOM parser or SAX parser。如果要解析大型文档,SAX会更快。如果文档很小,则没有太大区别More on SAX vs DOM
# 2 楼答案
WebView是您的朋友:
http://developer.android.com/reference/android/webkit/WebView.html
它可以让你抓取html作为浏览器,然后你可以用它做一些事情。请注意,它没有考虑javascript,所以我希望您使用的是纯html,而不是ajax获取或js生成的代码:)
# 3 楼答案
对于HTML解析,可以使用jsoup。使用非常简单,API也很棒
http://jsoup.org/
对我来说,效果很好
编辑: 太慢了:D skyuzo的帖子很棒:)