我一直在尝试编写一个脚本,一次从here下载所有外汇对历史数据(ZIP格式)。你知道吗
我遇到的问题是,在包含指向该文件的链接的最后一个页面上,我没有获得对该文件的任何引用,而href只显示:
href=“j”avascript:返回true;““
<a id="a_file" title="Download the zip data file" href="javascript:return true;" target="nullDisplay">HISTDATA_COM_MT_EURUSD_M1_201905.zipHISTDATA_COM_MT_EURUSD_M1_201905.zip</a>
Here是指向其中一个下载页面的链接。你知道吗
抓取下载页http://www.histdata.com/download-free-forex-historical-data/?/metatrader/1-minute-bar-quotes/eurusd/2018,然后获取name=“tk”^{id1}的值$
你还可以得到所有其他的身份证。。。你知道吗
然后您需要下载带有请求的ZIP文件:
然后将其写入HDD并等待其完成写入:
把这些都放在一个循环中,通过你喜欢的FXpair和时间范围,然后你就可以自动刮取站点了:
如果你把以上几部分放在一起,再加上导入,你就有了这个网站的scrape软件。你知道吗
使用chromedev工具可以探索发送的确切请求类型,还可以查找正在发送的其他表单数据和头。你知道吗
对于您的情况,我找到了头和数据以便下载ZIP文件。下面的代码应该可以正常工作。在使用下面的代码之前,只需安装
requests
库。你知道吗注意:这也可以下载大文件,因为它不读取内存中的任何数据。
相关问题 更多 >
编程相关推荐