您好,我正在尝试scape一个HTML表,我有工作代码
然而,一个URL包含两个html表。第一个表包含“季度”数字,默认情况下加载url。单击表格上方的按钮时,可以切换到第二个带有“年度”编号的表格
我的代码只拾取加载url时出现的第一个默认(季度)表
如何让我的python代码刮取第二个“年度”表?硒能做到这一点吗?如果有,谁能提供指导
#!/usr/local/bin/python3
import requests
import pandas as pd
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:74.0) Gecko/20100101 Firefox/74.0'}
r = requests.get("https://www.investing.com/equities/exxon-mobil-income-statement", headers=headers)
df = pd.read_html(r.content)[1]
print(df)
非常感谢
在谷歌搜索和其他一些堆栈帖子之后,终于实现了这一点:
请尝试以下操作:
对
你可以用硒来做
这里有一个python代码
它是干什么的?它进入页面,通过css选择器查找年度按钮元素,然后单击它。然后,它通过css选择器查找表并打印其HTML
希望能有帮助
相关问题 更多 >
编程相关推荐