试图从amazon获取数据

1条回答

网友

1楼 · 发布于 2024-04-26 02:47:23

我测试了它并修改了两件事：

用户代理
删除了类之间的双空格

代码如下：

import bs4 as bs
import requests

url = 'https://www.amazon.de/s/ref=nb_sb_noss_2?__mk_de_DE=%C3%85M%C3%85%C5%BD%C3%95%C3%91&url=search-alias%3Daps&field-keywords=folie'
c = requests.get(url, headers = { 'User-Agent' : 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:64.0) Gecko/20100101 Firefox/64.0'})
#print(c.content)
soup = bs.BeautifulSoup(c.content, 'html.parser')

data_search = soup.find_all('ul', {'id': 's-results-list-atf'})


for link in data_search:
    #print(link)
    #print(type(link))
    f = link.find_all('a', { 'class' : 'a-link-normal s-access-detail-page s-color-twister-title-link a-text-normal' })
    #print(f)
    for a in f:
        print(a)

这个代码的结果是：

<a class="a-link-normal s-access-detail-page s-color-twister-title-link a-text-normal" href="/gp/slredirect/picassoRedirect.html/ref=pa_sp_atf_aps_sr_pg1_1?ie=UTF8&amp;adId=A00173582V1J1Z4JYCC99&amp;url=https%3A%2F%2Fwww.amazon.de%2FAuto-Folie-selbstklebend-BLASENFREI-Klebefolie%2Fdp%2FB00TDS0PVE%2Fref%3Dsr_1_1_sspa%2F259-1606642-0146458%3Fie%3DUTF8%26qid%3D1548365739%26sr%3D8-1-spons%26keywords%3Dfolie%26psc%3D1&amp;qualifier=1548365739&amp;id=7589640135518839&amp;widgetName=sp_atf" title="4€/m² Auto Folie - schwarz matt - 3 x 1,5 meter selbstklebend BLASENFREI flexibel Car Wrapping Klebefolie"><h2 class="a-size-medium s-inline s-access-title a-text-normal" data-attribute="4€/m² Auto Folie - schwarz matt - 3 x 1,5 meter selbstklebend BLASENFREI flexibel Car Wrapping Klebefolie" data-max-rows="2"><span class="a-offscreen">[Gesponsert]</span>4€/m² Auto Folie - schwarz matt - 3 x 1,5 meter selbstklebend BLASENFREI flexibel Car Wrapping Klebefolie</h2></a>
<a class="a-link-normal s-access-detail-page s-color-twister-title-link a-text-normal" href="/gp/slredirect/picassoRedirect.html/ref=pa_sp_atf_aps_sr_pg1_2?ie=UTF8&amp;adId=A03283802DFVL9Z711KMN&amp;url=https%3A%2F%2Fwww.amazon.de%2FFOSHIO-T%25C3%25B6nungsfolie-Installation-Cuttermesser-Werkzeugtasche%2Fdp%2FB06XNRKD2X%2Fref%3Dsr_1_2_sspa%2F259-1606642-0146458%3Fie%3DUTF8%26qid%3D1548365739%26sr%3D8-2-spons%26keywords%3Dfolie%26psc%3D1&amp;qualifier=1548365739&amp;id=7589640135518839&amp;widgetName=sp_atf" title="FOSHIO Autofolie Wrapping Werkzeug Kit für Auto Tönungsfolie Installation Mit Magnete Filz, Schaber Kuststoff,Rakel mit Filzkante, Cuttermesser,Folienrakel und Handschuhe, Werkzeugtasche"><h2 class="a-size-medium s-inline s-access-title a-text-normal" data-attribute="FOSHIO Autofolie Wrapping Werkzeug Kit für Auto Tönungsfolie Installation Mit Magnete Filz, Schaber Kuststoff,Rakel mit Filzkante, Cuttermesser,Folienrakel und Handschuhe, Werkzeugtasche" data-max-rows="2"><span class="a-offscreen">[Gesponsert]</span>FOSHIO Autofolie Wrapping Werkzeug Kit für Auto Tönungsfolie Installation Mit Magnete Filz, Schaber Kuststoff,Rakel mit Filzkante, Cuttermesser,Folienrakel und Handschuhe, Werkzeugtasche</h2></a>
<a class="a-link-normal s-access-detail-page s-color-twister-title-link a-text-normal" href="https://www.amazon.de/BB-Verpackungen-Stretchfolie-transparent-Palettenfolie-Wickelfolie/dp/B004W3O4PS/ref=sr_1_3/259-1606642-0146458?ie=UTF8&amp;qid=1548365739&amp;sr=8-3&amp;keywords=folie" title="BB-Verpackungen Hand Stretchfolie 23 my (transparent) 500 mm x 285 m, Palettenfolie Handfolie Wickelfolie"><h2 class="a-size-medium s-inline s-access-title a-text-normal" data-attribute="BB-Verpackungen Hand Stretchfolie 23 my (transparent) 500 mm x 285 m, Palettenfolie Handfolie Wickelfolie" data-max-rows="2">BB-Verpackungen Hand Stretchfolie 23 my (transparent) 500 mm x 285 m, Palettenfolie Handfolie Wickelfolie</h2></a>
<a class="a-link-normal s-access-detail-page s-color-twister-title-link a-text-normal" href="https://www.amazon.de/Neoxxim-22%E2%82%AC-Premium-blasenfrei-Luftkan%C3%A4len/dp/B01MYTRMXY/ref=sr_1_4/259-1606642-0146458?ie=UTF8&amp;qid=1548365739&amp;sr=8-4&amp;keywords=folie" title="Neoxxim 24,22€/m2 Premium - Auto Folie - MATT - SCHWARZ - SCHWARZ MATT 30 x 150 cm - blasenfrei mit Luftkanälen ca 0,15mm dick für Auto Folierung folieren bekleben"><h2 class="a-size-medium s-inline s-access-title a-text-normal" data-attribute="Neoxxim 24,22€/m2 Premium - Auto Folie - MATT - SCHWARZ - SCHWARZ MATT 30 x 150 cm - blasenfrei mit Luftkanälen ca 0,15mm dick für Auto Folierung folieren bekleben" data-max-rows="2">Neoxxim 24,22€/m2 Premium - Auto Folie - MATT - SCHWARZ - SCHWARZ MATT 30 x 150 cm - blasenfrei mit Luftkanälen ca 0,15mm dick für Auto Folierung folieren bekleben</h2></a>

我希望在那之后它能正常工作

编辑：它看起来像是用html代码操纵javascript，所以有必要先对find_all（）稍加修改。之后，我得到了34个结果，而不是第一个代码中的4个

import bs4 as bs
import requests

url = 'https://www.amazon.de/s/ref=nb_sb_noss_2?__mk_de_DE=%C3%85M%C3%85%C5%BD%C3%95%C3%91&url=search-alias%3Daps&field-keywords=folie'
c = requests.get(url, headers = { 'User-Agent' : 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:64.0) Gecko/20100101 Firefox/64.0'})
#print(c.content)
soup = bs.BeautifulSoup(c.content.replace("<! ", "").replace(" >", ""), 'html.parser')   #remove comments tags

data_search = soup.find_all('ul', {'class': 's-result-list'})

count = 0
for link in data_search:
    #print(link)
    #print(type(link))
    f = link.find_all('a', { 'class' : 'a-link-normal s-access-detail-page s-color-twister-title-link a-text-normal' })
    #print(f)
    for a in f:
        print(a)
        count += 1

print(count)

相关问题更多 >

编程相关推荐

热门问题

热门文章

试图从amazon获取数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >