如何从网站上刮取2级网页

2024-04-27 04:18:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我想问你如何使用python+Beautiful soup或Scrapy来抓取网页,例如,如果有两个级别的页面,一个简短的描述+一个指向职位完整细节的链接,那么其中包含职位公告?我需要从职位公告的标题中刮取数据,然后深入提取完整的描述,并将数据添加到数据库或文本文件中?问题是到了第二个层次,在那里完整的描述生活,并获得完整的细节,包括图像链接,如果存在。。。 有人这样做过吗

先谢谢你


Tags: 数据数据库网页标题链接职位页面公告