我试图从亚马逊搜索中找到结果的标题,但我找不到
import bs4 as bs
import requests
url = 'https://www.amazon.de/s/ref=nb_sb_noss_2?__mk_de_DE=%C3%85M%C3%85%C5%BD%C3%95%C3%91&url=search-alias%3Daps&field-keywords=folie'
c = requests.get(url)
soup = bs.BeautifulSoup(c.content, 'lxml')
data_search = soup.find_all('ul', {'id': 's-results-list-atf'})
for link in data_search:
print(link.contents[0].find_all('a',
{
'class': 'a-link-normal s-access-detail-page s-color-twister-title-link a-text-normal'}))
我现在没有得到任何结果,我也不知道为什么
正在尝试获取此标题
编辑:
试图获得该产品的品牌,但我的主机刚刚收到垃圾邮件
import bs4 as bs
import requests
from lxml import etree
browser2 = {
'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36'}
s = requests.Session()
res = s.get('https://login.live.com')
cookies = dict(res.cookies)
request2 = s.get(
'https://www.amazon.de/BB-Verpackungen-Stretchfolie-transparent-Palettenfolie-Wickelfolie/dp/B004W3O4PS',
headers=browser2)
soup2 = bs.BeautifulSoup(request2.content, 'lxml')
start = soup2.find_all('div', class_='centerColAlign')
for s in start:
brand = s.find_all('div', class_='a-section a-spacing-none')
for b in brand:
s = b.find_all('a', {'id': 'bylineInfo'})
for i in s:
print(i.text)
我测试了它并修改了两件事:
代码如下:
这个代码的结果是:
我希望在那之后它能正常工作
编辑: 它看起来像是用html代码操纵javascript,所以有必要先对find_all()稍加修改。之后,我得到了34个结果,而不是第一个代码中的4个
相关问题 更多 >
编程相关推荐