很难抓取/捕获网站表

2024-04-25 22:06:08 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从存储在表中的网站捕获数据。总共有4个表,前两个表捕获正确,但后两个表返回为空数据帧。我不知道这是因为最后两个表在HTML中埋得太深,还是因为加载这些表需要更长的时间。我也开始尝试Selenium,看看这是否有助于减少表的加载时间,但也没有运气

谢谢

import sys
import time
import requests
import pandas as pd

r = requests.get("https://netcapital.com/companies/ghost")
dfs = pd.read_html(r.text)
dfs

Output