我试图从一张方格图表格中获取内容。我是一个新手,所以我可能会犯一些错误
网址:https://www.fangraphs.com/standings/playoff-odds
看看网站中的元素,我可以看到有一些叫做“季后赛赔率表”的表格。这一切似乎都被卷进了 id="content".
到目前为止,我的代码是:
`url = 'https://www.fangraphs.com/standings/playoff-odds'
page = requests.get(url)
soup = BeautifulSoup(page.content,'html.parser')
soup.find("div", {"id": "content"})`
输出仅为:
<div class="playoff-odds-page" id="content"><h1>MLB Playoff Odds</h1><div id="root"></div>
很明显,我在这里遗漏了一些重要的东西,我很想学习如何将表格内容拉进去
谢谢你的帮助/建议
Vin的答案是正确的,但我要补充一点,我可能会使用json_normalize将其转换为一个表,以获得更好的输出,您可以进行排序、筛选等:
输出:
尝试下面的方法。在下面的脚本中,我使用了requests方式和JSON通过执行API调用来获取数据
我已经从网站中提取了API url,并将其传递给url变量,该变量是动态的,您可以将结束日期或日期增量放入变量中,它将相应地获取该时间段的数据
然后脚本使用getAPI方法获取结果,并将其传递给JSON,使其成为一个合适的JSON对象
最后,为每个团队逐个打印所有列(请参阅屏幕截图)。
相关问题 更多 >
编程相关推荐