PDF-Miner处理tex的方法

2024-05-23 17:31:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我不确定标题是否足够清楚,但我会尽量在这里解释得更好。你知道吗

我有一个PDF文件,我需要看看它是否包含一些字符。例如,这里有:https://imgur.com/a/InsLI

我需要一行写着“合同号XXXXX”。从现在起,我所做的就是得到文本,但我所做的是:

Client
Contrat
Produit

n°XXXXXX
n°XXXXX
XXXXX

但我想要的是这样的:

Client n°XXXX
Contrat n°XXXX
Produit XXXXXXX

有没有办法做到这一点?你知道吗

谢谢


Tags: 文件https文本comclient标题pdf字符