docx模块创建、读取和写入Microsoft Office Word 2007 docx文件
docx的Python项目详细描述
简介
docx模块创建、读取和写入Microsoft Office Word 2007 docx 文件夹。
它们被称为“wordml”、“office open xml”和“open xml” 微软。
这些文档可以在Microsoft Office 2007/2010、Microsoft Mac中打开 Office 2008、Google Docs、OpenOffice.org 3和Apple iWork 08。
他们也validate as well formed XML。
该模块是在我寻找对ms-word的python支持时创建的 .docx文件,但只能找到涉及COM自动化的各种黑客, 调用.NET或Java,或自动化OpenOffice或MS Office。
docx模块具有以下功能:
制作文件
制作文档的功能包括:
- 段落
- 项目符号
- 编号列表
- 文档属性(作者、公司等)
- 多级标题
- 表格
- 分节和分页符
- 图像
编辑文档
由于LXML模块的卓越性,我们可以:
- 搜索并替换
- 提取文档的纯文本
- 在文档中的任何位置添加和删除项目
- 更改文档属性
- 对文档中的特定位置运行xpath查询-对于 正在从用户完成的模板中检索数据。
开始
制作和修改文档
使用pip或easy_install获取lxml和pil模块。
然后运行:
example-makedocument.py
恭喜你,你刚刚制作并修改了一个word文档!
从文档中提取文本
如果只想从word文件中提取文本,请运行:
example-extracttext.py 'Some word file.docx' 'new file.txt'
想法和待办事项列表
- 图像处理的进一步改进
- 记录健康检查
- 鸡蛋
- 降价转换支持
我们喜欢叉子、更改和拉取请求!
- 查看[黑客](hacking.markdown)以添加您自己的更改!
- 对于github上的这个项目
- 通过github发送拉取请求,我们将添加您的更改!
想谈谈吗?需要帮助吗?