问题:链接列表显示为空
怀疑是什么导致了问题:我认为我告诉它抓取的标签是错误的
程序功能:
上下文:我已经完成了《自动化无聊的东西》的第11章,并且使用了与第一个项目相同的代码,只是我对它做了一些调整,以搜索亚马逊搜索结果,而不是谷歌。你知道吗
我尝试了哪些标签:
#! python3
#Shop on Amazon - searchs amazon and opens the first 5 top results
import sys,requests,bs4,webbrowser,logging
print ('Searching')
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.71 Safari/537.36'
}
res = requests.get('https://www.amazon.com/s?k=' + ''.join(sys.argv[1:]))
res.raise_for_status
soup = bs4.BeautifulSoup(res.text,features = 'html.parser')
linkElems = soup.select('a.a-link-normal a-text-normal')
numOpen = min(5, len(linkElems))
for i in range(numOpen):
webbrowser.open('https://amazon.com' + linkElems[i].get('href'))
HTML我试图使用标签获取的链接示例:
你的问题是你的css选择器
'a.a-link-normal a-text-normal'
。这将在类为a-link-normal
的a
标记中查找a-text-normal
标记。你知道吗a-link-normal
和a-text-normal
都是相关a
标记的类。您可以在css选择器中通过如下链接来表示:'a.a-link-normal.a-text-normal'
。这表示您正在寻找同时具有类a-link-normal
和a-text-normal
的a
标记。你知道吗例如,这个脚本将在amazon上搜索您的命令行输入,收集所有链接(
links = soup.select('a.a-link-normal.a-text-normal')
),然后为找到的每个链接打印出href
属性。在这一点上,我只能说,它在我的机器上工作。你知道吗相关问题 更多 >
编程相关推荐