擅长:python、mysql、java
<p>如果我理解正确的话,你是在寻找图像的src,在那之后提取它。</p>
<p>首先,您需要找到(使用检查器)HTML中的哪个位置是图像。例如,在我的粒子案例中,我要取消足球队的防护罩,我需要:</p>
<pre><code>m_url = 'http://www.marca.com/futbol/primera/equipos.html'
client = uOpen(m_url)
page = client.read()
client.close()
page_soup = BS(page, 'html.parser')
teams = page_soup.findAll('li', {'id': 'nombreEquipo'})
for team in teams:
name = team.h2.text
shield_url = team.img['src']
</code></pre>
<p>然后,你需要处理图像。你必须有选择。</p>
<p>第一:使用numpy:</p>
<pre><code>def url_to_image(url):
'''
Función para extraer una imagen de una URL
'''
resp = uOpen(url)
image = np.asarray(bytearray(resp.read()), dtype='uint8')
image = cv2.imdecode(image, cv2.IMREAD_COLOR)
return image
</code></pre>
<p>shield=url_to_图像(shield_url)</p>
<p>第二次使用scikit image库(可能需要安装):</p>
<pre><code>shield = io.imread('http:' + shield_url)
</code></pre>
<p><strong>注意:</strong>就在这个特定的示例中,我需要在begging中添加http:。</p>
<p>希望有帮助!</p>