读取html未从表中找到所有行

2024-04-23 16:58:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用pandasread_html函数解析html表

我发现head方法出于某种原因删除了最后一行,因此我停止使用它

但是现在我注意到,尽管通过调试器(作为字符串)是可见的,但另一行被删除了。所以有了head我就有了5/7(行)和6/7(行)没有

这是我当前的代码:

r = get(f"site-censured").text
df = read_html(r)[0]

我正在访问这些值,就像df是一个矩阵一样,就像df[2][3]

我做错什么了吗

任何帮助都会很好,谢谢


1条回答
网友
1楼 · 发布于 2024-04-23 16:58:09

在创建和测试mcve时,我发现了错误。我一直在从1循环到df.shape[1],这将导致忽略最后一行,所以我只需要添加+1。 谢谢你的建议

相关问题 更多 >