擅长:python、mysql、java
<p>Urllib2用于提交http请求,beauthulsoup用于解析html。您肯定需要一个http请求库,而且您可能还需要BeautifulSoup,具体取决于您想要做什么。在</p>
<p><code>BeautifulSoup</code>非常容易使用,并且能够很好地解析断开的html,因此对于获取页面上任何javascript的链接非常有用(即使在html格式错误的情况下也是如此)。然后,您将需要其他东西来解析javascript,以确定它是否与cookies交互。在</p>
<p>要查看客户端上的cookie值是什么,只需查看http请求头或使用<code>cookielib</code>(尽管我个人没有使用过这个库)。在</p>
<p>对于http请求,我建议使用<code>requests</code>库,查看http请求头将非常简单:</p>
<pre><code>response = requests.get(url)
header = response.headers
</code></pre>
<p>我怀疑<code>requests</code>也有一个访问头的<code>Set-Cookie</code>值的快捷方式,但是您需要研究一下。在</p>