pythondocx如何获取节的内容/正文 - 问答 - Python中文网

pythondocx如何获取节的内容/正文

2024-04-23 10:07:17 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我使用Word的sections术语，使每个页面都有不同的页眉，在这里我用一些标记来标记页面，比如{page1}。

使用python-docx我可以通过以下方式获取节：

doc = Document(my_file)`
doc_sections = doc.sections
doc_page_one = doc_sections[0]

我可以得到每页的页眉和页脚及其文本： doc_page_one.header.paragraphs[0].text

但我看不到实际的页面内容/正文或形状，在调试时我无法找到它们的位置。

python-docx有这种可能性吗？

Tags：标记 doc my 方式 page 页面 document one

1条回答

网友

1楼 · 发布于 2024-04-23 10:07:17

目前，python-docx没有API支持来获取我想象中的“块项”（段落+表）是“包含”在某个部分中的。在

如果您非常想要底层XML，就必须导航它，可能从document.__body开始。您可以通过以下方式了解它的外观：

print(document.__body.xml)

基本上，您将查找w:sectPr元素，每个元素的结束于一个部分。这里有关于python-docx分析页面中所涉及的XML模式的更多细节：https://python-docx.readthedocs.io/en/latest/dev/analysis/features/sections.html

相关问题更多 >

编程相关推荐

热门问题

热门文章