使用pythondocx检测损坏的文档文件

2024-04-20 07:35:47 发布

您现在位置:Python中文网/ 问答频道 /正文

你能帮我弄清楚这件事吗。 从PythonDocx(docx.Document(file_name))读取.docx文件时,如何检测docx文件是否正确或损坏

我遇到过一些情况,这些输入docx文件要么是空的,要么是损坏的。 如何使用此库标记这些案例


Tags: 文件name标记情况document案例filedocx
1条回答
网友
1楼 · 发布于 2024-04-20 07:35:47

python-docx中没有这样的功能。部分原因是,虽然根据ISO规范中的模式可以确定文件是否有效,但每个客户机都允许存在许多小的差异。允许的内容因客户而异;例如,LibreOffice接受的某些内容会在Microsoft Word中产生修复错误

确定这一点的唯一可靠方法是尝试使用目标客户机打开文件,在Microsoft Word的情况下,可能使用自动化(如VBA)

相关问题 更多 >