如何使用Python使用POST方法刮取页面？问题的回答

如何使用Python使用POST方法刮取页面？

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

<p>我想把一些报道星链星座段落的页面合并在一起。现在，我需要手动访问每个页面，不能根据时间和可见性进行筛选</p> <p>基本页面是<a href="https://heavens-above.com/StarlinkLaunchPasses.aspx?lat=50&lng=12&loc=Somewhere" rel="nofollow noreferrer">https://heavens-above.com/StarlinkLaunchPasses.aspx?lat=50&lng=12&loc=Somewhere</a></p> <p><a href="https://stackoverflow.com/questions/57239651/scrape-peekyou-com-having-post-method">Scrape peekyou.com ( having POST METHOD)</a>给了我一些提示，但还不足以让我站起来</p> <p>这是抓取第一页（最后一次Starlink启动）的GET代码：</p> <pre class="lang-py prettyprint-override"><code>import pandas as pd import requests from bs4 import BeautifulSoup res = requests.get(r"https://heavens-above.com/StarlinkLaunchPasses.aspx?lat=45.61&lng=15.312&loc=Somewhere&alt=0&tz=CET") soup = BeautifulSoup(res.content, 'lxml') table = str(soup.find_all("table", {"class": "standardTable"})) df = pd.read_html(table)[0] cols = "date satellite mag s_time s_altitude s_azimuth h_time h_altitude h_azimuth e_time e_altitude e_azimuth".split() df.columns = cols print(df) </code></pre> <p>单击下拉列表，通过POST方法请求其他页面。这里停止我的（肤浅的）网络刮知识</p> <p>我看到返回的<code>res.text</code>包含我可以用于下一个请求的表单数据，但我不知道如何提取它们：</p> <pre><code><form name="aspnetForm" method="post" action="/StarlinkLaunchPasses.aspx?lat=48.55&amp;lng=11.53&amp;loc=Somewhere&amp;alt=0&amp;tz=CET" id="aspnetForm"> <input type="hidden" name="__VIEWSTATE" id="__VIEWSTATE" value="DprSo0lEG4wbQojWQ3ub7mILDflL+omP+KQ .../> ... <input type="hidden" name="__VIEWSTATEGENERATOR" id="__VIEWSTATEGENERATOR" value="9E5B71D1" /> <input type="hidden" name="utcOffset" id="utcOffset" value="7200000" /> ... <input type="hidden" name="ctl00$cph1$hidStartUtc" id="ctl00_cph1_hidStartUtc" value="637211090517289358" /> ... # and here is the dropdown list: <select name="ctl00$cph1$ddlLaunches" id="ctl00_cph1_ddlLaunches"> <option selected="selected" value="2020019">Starlink 5, 18 March 2020 12:16</option> <option value="2020012">Starlink 4, 17 February 2020 15:06</option> <option value="2020006">Starlink 3, 29 January 2020 14:07</option> <option value="2020001">Starlink 2, 07 January 2020 02:19</option> <option value="2019074">Starlink 1, 11 November 2019 14:56</option> <option value="2019029">Starlink 0, 24 May 2019 02:30</option> </select> </code></pre> <p>你能帮我找到一个可能的解决办法吗</p> <p>先谢谢你</p>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

如何使用Python使用POST方法刮取页面？

1 个回答

相关Python问题