擅长:python、mysql、java
<p>您可以使用请求模块来获取数据</p>
<p>在下面的例子中,我从所有有“比萨饼”字样的网站上获取数据</p>
<pre><code>import requests
url = 'http://www.google.com/search'
my_headers = { 'User-agent' : 'Mozilla/11.0' }
payload = { 'q' : 'pizza', 'start' : '0' }
r = requests.get( url, params = payload, headers = my_headers )
</code></pre>
<p>您可以使用BeautifulSoup库从检索到的数据(HTML数据)中提取任何类型的信息</p>
<pre><code>from bs4 import BeautifulSoup
soup = BeautifulSoup( r.text, 'html.parser' )
</code></pre>
<p>现在,如果需要文本数据,可以使用此函数</p>
<pre><code>soup.getText()
</code></pre>