使用Python中的BeautifulSoup解析器提取src

2024-04-27 00:07:20 发布

您现在位置:Python中文网/ 问答频道 /正文

需要用python中的beatifulsoup提取标签中的src分部参与人-“徽标”。在

import requests
import bs4

root_url = 'here url to parse'

response = requests.get(root_url)
soup = bs4.BeautifulSoup(response.text)

logo_cuadro1 = soup.select('div.participant-logo')

print (logo_cuadro1)

代码HTML

^{2}$

Tags: importsrcurlhereresponseroot标签requests
2条回答

要获取src:

soup = bs4.BeautifulSoup("""<td class="participant-logo"><a href="/futbol/espana/equipo-cordoba-cf-8004992.html"><img src="http://medias/logos/icons/teams-80/7869.png?v=2"></a></td>""")

logo_cuadro1 = soup.find("img")["src"]

print (logo_cuadro1)

http://medias/logos/icons/teams-80/7869.png?v=2

在您的情况下:

^{pr2}$

您可以将CSS选择扩展到具有src属性的图像:

for img in soup.select('div.participant-logo img[src]'):
    print img['src']

相关问题 更多 >