用python抓取网页以获取onclick值

2024-04-23 12:17:41 发布

您现在位置:Python中文网/ 问答频道 /正文

首先,我要说的是:对我有耐心,因为我不熟悉我要给你们说明的论点。在

我想在法兰克福证券交易所网站上下载一些股票的日内历史价值。让我以这个股票为例:http://www.boerse-frankfurt.de/en/equities/adidas+ag+DE000A1EWWW0/price+turnover+history/tick+data#page=1

你可以看到有两种选择:在法兰克福交易和在Xetra交易。我想下载latters。我试图收集数据,但我对python的知识非常贫乏。在

如何“选择”所需的onclick选项?在

感谢您的回复。问候

Ps:为了您的信息,我注意到检查Xetra元素的以下事实:当我转到下一页时,它的值会发生变化,如果我返回,值也会再次不同。这里有一个例子:我第一次在第一页

a onclick="d39081344_fkt_set_par('6');d39081344_fkt_set_active(this);" class="brs_d39081344_li current last"

,然后我转到第2页,得到了

^{pr2}$,回到第1页我得到了^{pr3}$

Tags: http网站www交易历史股票证券价值
1条回答
网友
1楼 · 发布于 2024-04-23 12:17:41

诀窍是在浏览页面时查看调用的内容。你的浏览器的网络分析工具是非常宝贵的。当我从一个页面转到另一个页面时,会向“http://www.boerse-frankfurt.de/en/parts/boxes/history/_tickdata_full.m”发送一个关于请求的数据。在

然后目标是使用python复制和循环请求。以下是让您开始使用的代码:

import requests
r = requests.post('http://www.boerse-frankfurt.de/en/parts/boxes/history/_tickdata_full.m', data={'component_id':'PREKOP97077bf9dec39f14320bf9d40b636c7c589', 'page':"3", 'page_size':'50', 'boerse_id':'6', 'titel':'Tick-Data', 'lang':'en', 'text':'LOcbaec84ecad1b94ad2fd257897c87361', 'items_per_page':'50', 'template':'0', 'pages_total':'50', 'use_external_secu':'1', 'item_count':'2473', 'include_url':'/parts/boxes/history/_tickdata_full.m', 'ag':'291', 'secu':'291', })
print r.text #here is your data of interest, it still needs to be parsed

这是总的想法。然后将其放入一个循环中,每次都在page参数中添加一个。在

相关问题 更多 >