我试图推断出一个网站的价格,以便创建一个刮板我写下了下面的程序。为了得到所有的html代码,我使用了BeautifulSoup和默认的html.parser。然后我尝试使用一个名为generale equals to soup.findAll(“span”)的变量来清理信息。然后我需要进一步清理(列表(我想)它已经创建)以获得价格,我被卡住了。有什么建议吗?我不知道如何思考才能解决这个问题
import smtplib
import time
from bs4 import BeautifulSoup as bs
import requests
URL = "https://www.allkeyshop.com/blog/buy-battlefield-5-cd-key-compare-prices/"
headers = {"User-Agent": "Mozilla/5.0 (X11; Linux x86_64; rv:68.0) Gecko/20100101 Firefox/68.0"}
def Check_page1():
page = requests.get(URL, headers=headers)
soup = bs(page.content, 'html.parser')
generale = soup.findAll('span')
price = ?
print(price)
print(generale)
print(Check_page1())
似乎没有
<span class="price">
。 我就是这么做的有很多跨度。对我来说,下面这些看起来最像价格
所以我改进了正则表达式
当您查看页面的源代码时,可以看到您正在查找类名为
<span>
的price
,并且可以按以下方式进行分析:相关问题 更多 >
编程相关推荐