如何使用BeautifulSoup4打开亚马逊的链接？

#! python3 #Shop on Amazon - searchs amazon and opens the first 5 top results import sys,requests,bs4,webbrowser,logging print ('Searching') headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.71 Safari/537.36' } res = requests.get('https://www.amazon.com/s?k=' + ''.join(sys.argv[1:])) res.raise_for_status soup = bs4.BeautifulSoup(res.text,features = 'html.parser') linkElems = soup.select('a.a-link-normal a-text-normal') numOpen = min(5, len(linkElems)) for i in range(numOpen): webbrowser.open('https://amazon.com' + linkElems[i].get('href'))

1条回答

网友

1楼 · 发布于 2024-04-25 04:17:02

你的问题是你的css选择器'a.a-link-normal a-text-normal'。这将在类为a-link-normal的a标记中查找a-text-normal标记。你知道吗

a-link-normal和a-text-normal都是相关a标记的类。您可以在css选择器中通过如下链接来表示：'a.a-link-normal.a-text-normal'。这表示您正在寻找同时具有类a-link-normal和a-text-normal的a标记。你知道吗

例如，这个脚本将在amazon上搜索您的命令行输入，收集所有链接（links = soup.select('a.a-link-normal.a-text-normal')），然后为找到的每个链接打印出href属性。在这一点上，我只能说，它在我的机器上工作。你知道吗

from bs4 import BeautifulSoup
import requests
from sys import argv


r = requests.get("https://www.amazon.com/s?k=" + '+'.join(argv[1:]))
r.raise_for_status()

soup = BeautifulSoup(r.content, 'html.parser')
links = soup.select('a.a-link-normal.a-text-normal')

for tag in links:
    print(tag.attrs['href'])

相关问题更多 >

编程相关推荐

热门问题

热门文章