擅长:python、mysql、java
<p>BeautifulSoup是一个HTML解析器,不是web浏览器,它不能导航或下载页面。为此,您通常使用一个HTTP库,比如<code>urllib</code>或<code>request</code>,从一个特定的URL获取HTML,以便将其馈送给BeautifulSoup。在你的例子中,<code>mechanize</code>可以用来做这个。</p>
<p>不幸的是,pagination按钮提供的HTML不是链接,因此它没有<code>href</code>属性。如果是这样的话,您就可以很容易地解析它的URL并告诉HTTP库去获取它。</p>
<p>相反,您需要使用mechanize来模拟该按钮上的单击事件,稍等片刻,然后假设新页面已加载,然后将生成的HTML传递给BeautifulSoup。</p>