我正试图刮一个网页naukri.com,因为我想刮页面上特定个人资料的所有工作岗位
当我尝试使用请求和bs4时,我得到的只是编码文本。下面是屏幕抓图,我得到的回应和我试图抓取的URL
这是代码
url = "https://www.naukri.com/financial-analyst-jobs-in-mumbai?k=financial%20analyst&l=mumbai"
response = requests.get(url)
response.encoding
soup = BeautifulSoup(response.content)
soup
我不是一个专家在网页抓取,因此任何帮助将被高度赞赏
谢谢
您可以使用
requests
响应的.text
属性,使用requests
库将数据加载到bs4对象中。这是加载数据的最快方法,无需配置或等待其他库加载页面例如:
现在有一个bs4对象来进行解析
尝试使用
selenium
获取网站的html代码:输出:
相关问题 更多 >
编程相关推荐