我是一个刚学Python的新手,然而,对于我们的学士学位论文,我们需要以下网站的数据(它只是拉脱维亚政府的市政财政数据):
https://e2.kase.gov.lv/pub5.5_pasv/code/pub.php?module=pub
到目前为止,我已经做了以下工作:
import requests
from bs4 import BeautifulSoup
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
r = requests.get("https://e2.kase.gov.lv/pub5.5_pasv/code/ajax.php?module=pub&job=getDoc&period_id=1626&org_id=2542&blank_id=200079¤cy_id=2&editable=1&type=HTML", headers=headers)
print(r.text)
所以我被困在第六点。URL在Chrome中运行良好,在Edge中不起作用。我的Python代码似乎得到了相同的空白页边缘浏览器得到-没有任何数据。你知道吗
如果有人能帮我找到正确的方向或者给我一些阅读材料,我会非常感激,因为现在我不知道如何配置我的Python代码来重现Chrome的HTML输出。。或者如果这是一个合法的(或良好的)方式,如何处理这个问题,以获得这些数据。你知道吗
编辑:抱歉,伙计们,我发现这是不可能从拉脱维亚以外的访问这个网站,但是,我已经找到了一个解决方案(见下文)。你知道吗
解决了问题。你知道吗
以前在模拟浏览器时,我只使用以下标题:
原来我必须包含发送到服务器的请求的所有响应头(通过Chrome开发工具找到),如下所示:
相关问题 更多 >
编程相关推荐