Python中的HTML转.doc转换器?

14 投票
4 回答
21565 浏览
提问于 2025-04-16 07:20

我正在使用pisa,这是一个可以把HTML转换成PDF的Python库。

有没有类似的东西可以把HTML转换成Word文档,也就是一个HTML转.doc的Python库呢?

4 个回答

2

如果有人也想把文件格式转换成另一种方式,上面的代码是可以用的,但你需要修改一下FileFormat的值。

http://msdn.microsoft.com/en-us/library/ff839952.aspx

举个例子:过滤后的html格式是10,而不是0。

5

虽然我不知道有没有直接的模块可以让你完成这个转换,但你可以这样做:

  1. 首先,你可以使用 html2text 模块把 HTML 转换成 纯文本
  2. 然后,你可以用 python-docx 模块把这个文本转换成 docdocx 文件。
13

你可以使用来自 pywin32 的 win32com 这个工具,它是为 Windows 系统的 Python 扩展。这样可以让 MS Word 帮你进行转换。下面是一个简单的例子:

import win32com.client

word = win32com.client.Dispatch('Word.Application')

doc = word.Documents.Add('example.html')
doc.SaveAs('example.doc', FileFormat=0)
doc.Close()

word.Quit()

撰写回答