我试图从页面的链接中刮取href
属性,但最终以[]
作为输出
HTML代码是:
<div class="style__width-100p___2woP5 style__flex-row___m8FHw">
<div class="style__product-card___1gbex style__card___3eL67 style__raised___3MFEA style__white-bg___10nDR style__overflow-hidden___2maTX">
<a href="/drugs/augmentin-625-duo-tablet-138629" target="_blank" class="button-text style__flex-row___2AKyf style__flex-1___A_qoj style__product-name___HASYw">
</div>
</div>
用于刮削的代码:
links = [a['href'] for a in soup.find_all('div', attrs={'class': 'style__width-100p___2woP5 style__flex-row___m8FHw'})]
print(links)
我期望的输出是:
/drugs/augmentin-625-duo-tablet-138629
这是你想要的吗
输出:
您正在尝试从内部
div
而不是a
标记获取href
。要从想要的div
获取所有链接,您可以使用以下内容:相关问题 更多 >
编程相关推荐