用python获取google结果状态

def numResults(): try: page_google = '''http://www.google.de/#output=search&sclient=psy-ab&q=pokerbonus&oq=pokerbonus&gs_l=hp.3..0i10l2j0i10i30l2.16503.18949.0.20819.10.9.0.1.1.0.413.2110.2-6j1j1.8.0....0...1c.1.19.psy-ab.FEBvxrgi0KU&pbx=1&bav=on.2,or.r_qf.&bvm=bv.48705608,d.Yms&''' req_google = Request(page_google) req_google.add_header('User Agent', 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:15.0) Gecko/20120427 Firefox/15.0a1') html_google = urlopen(req_google).read() soup = BeautifulSoup(html_google) scounttext = soup.find('div', id='resultStats') except URLError as e: print(e) return scounttext

1条回答

网友

1楼 · 发布于 2024-05-26 19:54:06

如果您还没有解决这个问题，那么beauthulsoup找不到任何东西的原因似乎是resultStats从未出现在soup中—您的请求（page_google）只返回JavaScript，而不是JavaScript动态加载的任何搜索结果。您可以通过添加

print(soup)

命令，您将看到resultStats div不会出现。在

以下代码：

^{pr2}$

将打印

<div class="sd" id="resultStats">Ungefähr 1.060.000 Ergebnisse</div>

最后，使用Selenium Webdriver这样的工具可能是解决这个问题的更好方法，因为Google不允许机器人抓取搜索结果。在

相关问题更多 >

编程相关推荐

热门问题

热门文章