我正在尝试从https://gmatclub.com/forum/decision-tracker.html中删除数据。经过大量的点击和试用,我仍然无法确定如何从表中获取数据
import requests
from bs4 import BeautifulSoup
url = "https://gmatclub.com/forum/decision-tracker.html"
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
container = soup.find('div', attrs = {'class' : 'mainPage'})
print(container)
如果您想练习,请查看
Developer Toos -> Network -> XHR
并获取更新端点:并使用它获取当前数据
以下是方法:
这将输出一个字典列表,实际上是您的表。然后,您可以从中访问任何密钥
或者您可以将响应转储到
pandas dataframe
。例如:输出:
如果您愿意,请将其另存为
.csv
文件:相关问题 更多 >
编程相关推荐