有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java如何使用Apache的HttpClient库模拟滚动?

有些网页一开始内容有限,滚动时只显示更多内容,例如https://answers.yahoo.com/dir/index?sid=396545161&tab=popular&filter=lang&sort=popular

对人类来说,这并不构成问题。然而,当试图用Apache的HttpClient库自动处理这些数据时,这确实会带来问题。如何让HttpClient在Yahoo Answers页面上获取更多主题

仔细查看页面上的javascript,可以看到对

[GET] https://answers.yahoo.com/xhr-cat-popular.php?filter=lang&sort=popular&ct=1408831552&cl=1408831552&offset=21&categoryId=396545161&page=2&_txnid=1408831555799&crumb=TVGhgfkE0db
[GET] https://answers.yahoo.com/xhr-cat-popular.php?filter=lang&sort=popular&ct=1408831552&cl=1408831552&offset=41&categoryId=396545161&page=3&_txnid=1408831557894&crumb=TVGhgfkE0db
[GET] https://answers.yahoo.com/xhr-cat-popular.php?filter=lang&sort=popular&ct=1408831552&cl=1408831552&offset=61&categoryId=396545161&page=4&_txnid=1408831823937&crumb=TVGhgfkE0db
[GET] https://answers.yahoo.com/xhr-cat-popular.php?filter=lang&sort=popular&ct=1408831552&cl=1408831552&offset=81&categoryId=396545161&page=5&_txnid=1408831827678&crumb=TVGhgfkE0db

等,为后续页面提供所需内容。然而,当在我的浏览器窗口(或HttpClient)中打开这些链接时,我只会被重定向到主页。我是否遗漏了什么,或者我应该如何欺骗服务器,使其认为我只是请求下一页内容的javascript


共 (1) 个答案

  1. # 1 楼答案

    你不能(至少不能在任何地方都起作用)。该功能使用Javascript,而HttpClient不理解Javascript

    您可以查看页面源代码,确定是否有办法获取更多内容,但这可能很棘手(缩小javascript或其他类似障碍)