用python读取pdf格式的双面表

2024-04-26 12:26:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个双面的pdf文档,有一个表格,正在继续。你知道吗

第一面和第二面: enter image description here

我想把它放到python的数据帧中。我正在运行以下线路:

from tabula import read_pdf
df = read_pdf("C:/.../20191212.pdf", pages=2)
df.head()

问题是输出看起来像: enter image description here

所以问题是表是错误的,我希望第0行是表头,第一个表头中的文本应该已经成了行和列。你知道吗

我怎样才能解决这个问题?这篇文章链接到tabula。你知道吗


Tags: 数据from文档importdfreadpdf错误