我想请求此url:
https://www.codal.ir/CompanyList.aspx
此url包含110个页面上的表,当页面更改时,url和新请求都不会更改
这是我的代码:
import requests as req
req = req.Session()
isics = req.get("https://www.codal.ir/CompanyList.aspx")
print(isics.text)
但我只获得第一页信息。我打算通过请求和正则表达式从表中提取所需信息,但如果您有其他方法,我将很高兴听到。感谢您帮助我获取整个页面
我使用
Selenium
在表中导航。您不能使用requests
来实现这一点,因为我们没有将我们重定向到表中新页面的链接。您可以在下面找到代码主要工作原理是浏览表格并收集公司网站的链接。当最后一页索引等于当前索引时,我们使用
next
按钮导航并停止,这表明我们到达了表的末尾相关问题 更多 >
编程相关推荐