pythondocx如何获取节的内容/正文

2024-04-23 10:07:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用Word的sections术语,使每个页面都有不同的页眉,在这里我用一些标记来标记页面,比如{page1}

使用python-docx我可以通过以下方式获取节:

doc = Document(my_file)`
doc_sections = doc.sections
doc_page_one = doc_sections[0]

我可以得到每页的页眉和页脚及其文本: doc_page_one.header.paragraphs[0].text

但我看不到实际的页面内容/正文或形状,在调试时我无法找到它们的位置。

python-docx有这种可能性吗?


Tags: 标记docmy方式page页面documentone
1条回答
网友
1楼 · 发布于 2024-04-23 10:07:17

目前,python-docx没有API支持来获取我想象中的“块项”(段落+表)是“包含”在某个部分中的。在

如果您非常想要底层XML,就必须导航它,可能从document.__body开始。您可以通过以下方式了解它的外观:

print(document.__body.xml)

基本上,您将查找w:sectPr元素,每个元素的结束于一个部分。这里有关于python-docx分析页面中所涉及的XML模式的更多细节:https://python-docx.readthedocs.io/en/latest/dev/analysis/features/sections.html

相关问题 更多 >