我是一个非常新的编程,所以我道歉,如果这真的很简单。我已经掌握了Python的基本知识,并且一直在尝试学习如何提取这个网站上的表:https://rotogrinders.com/grids/nfl-targets-1402017?site=draftkings。问题是,该表不是作为传统的HTML表设置的,而是由<div>
构成的,似乎是通过脚本填充的?我一直在四处寻找,试图找到一个类似的情况已经解决,但我不知道我是否搜索正确。以下是我目前的代码:
import requests
from bs4 import BeautifulSoup
page = requests.get("https://rotogrinders.com/grids/nfl-targets-1402017?site=draftkings")
soup = BeautifulSoup(page.content, 'html.parser')
table = soup.find('div', attrs={'class': 'bat'})
print(table.prettify())
我没走多远就遇到了这个问题。如果你知道一个可能的解决方案或一个例子,我可以学习,请让我知道。你知道吗
在这种情况下,
selenium
与BeautifulSoup
结合起来就很方便了。除此之外,通常还需要使用浏览器仔细检查元素。你知道吗在本例中,我使用了
Firefox
(这要求geckodriver
正确安装并放置在适当的位置),但是您也可以使用Chrome
或您选择的任何浏览器。你知道吗。。。所以,当你
print(players)
,你会得到一个很好的排序信息:。。。也就是说你可以这样做:
嗒嗒!你知道吗
相关问题 更多 >
编程相关推荐