我目前正试图从craigslist上获取航空数据。除了每篇文章的第一张图片,我没有问题获得我想要的所有信息。这是我的链接:
https://spokane.craigslist.org/search/avo?hasPic=1
我已经能够得到所有的图片感谢一个不同的职位在这个网站上,但我有困难,找出如何只得到第一张图片
我正在使用bs4并请求此脚本。以下是我迄今为止获得的所有图像:
from bs4 import BeautifulSoup as bs
import requests
image_url = 'https://images.craigslist.org/{}_300x300.jpg'
r = requests.get('https://spokane.craigslist.org/search/avo?hasPic=1')
soup = bs(r.content, 'lxml')
ids = [item['data-ids'].replace('1:','') for item in soup.select('.result-image[data-ids]', limit = 10)]
images = [image_url.format(j) for i in ids for j in i.split(',')]
print(images)
非常感谢您的帮助
提前感谢,
英泽尔
以下是一个简洁明了的解决方案:
输出:
如果您有任何问题,请告诉我:)
您需要找到图像库中的所有类,然后获取数据ID。 然后将它们拆分为一个列表,并获取第一个元素[0]
结果:
['https://images.craigslist.org/00N0N_ci3cbcv5T58_300x300.jpg','https://images.craigslist.org/00101_5dLpBXXdDWJ_300x300.jpg','https://images.craigslist.org/00n0n_8zVXHONPkTH_300x300.jpg','https://images.craigslist.org/00l0l_jiNMe38avtl_300x300.jpg','https://images.craigslist.org/01212_fULyvfO9Rqz_300x300.jpg','https://images.craigslist.org/00D0D_ibbWWn7uFCu_300x300.jpg','https://images.craigslist.org/00z0z_2ylVbmdVnPr_300x300.jpg','https://images.craigslist.org/00Q0Q_ha0o2IJwj4Q_300x300.jpg','https://images.craigslist.org/01212_5LoZU43xA7r_300x300.jpg','https://images.craigslist.org/00U0U_7CMAu8vAhDi_300x300.jpg']
输出:
该列表包含每个帖子的第一张图片
相关问题 更多 >
编程相关推荐