我试图在HTML表的每一行中只获取第一个href。在soup对象上使用find\u all不起作用,因为有多个表,所以我使用汤.选择()仅隔离该表并从中工作,但它似乎不起作用。你知道吗
尝试单独在soup对象上使用find\u all,尝试使用find()在表行中循环,但它表示返回“NoneType”。你知道吗
我希望能够存储一个以[/players/a/abrinal01.html,“/players/a/acyqu01.html等”开头的列表
url = 'https://www.basketball-reference.com/leagues/NBA_2019_per_game.html'
res = requests.get(url)
res.raise_for_status()
soup = bs4.BeautifulSoup(res.text, 'html.parser')
table = soup.find("table", { "id" : "per_game_stats" })
我会使用集合理解来删除重复项,而且我认为
nth-of-type
选择适当的列会读得更清楚。使用bs4.7.1您还可以使用以下css选择器:
您可以通过使用
all_per_game_stats
的id
从外部div
包装器锚定解析来访问所需的数据:输出:
相关问题 更多 >
编程相关推荐