Python中的HTML转.doc转换器?
我正在使用pisa,这是一个可以把HTML转换成PDF的Python库。
有没有类似的东西可以把HTML转换成Word文档,也就是一个HTML转.doc的Python库呢?
4 个回答
2
如果有人也想把文件格式转换成另一种方式,上面的代码是可以用的,但你需要修改一下FileFormat的值。
http://msdn.microsoft.com/en-us/library/ff839952.aspx
举个例子:过滤后的html格式是10,而不是0。
5
虽然我不知道有没有直接的模块可以让你完成这个转换,但你可以这样做:
- 首先,你可以使用 html2text 模块把 HTML 转换成 纯文本。
- 然后,你可以用 python-docx 模块把这个文本转换成 doc 或 docx 文件。
13
你可以使用来自 pywin32 的 win32com 这个工具,它是为 Windows 系统的 Python 扩展。这样可以让 MS Word 帮你进行转换。下面是一个简单的例子:
import win32com.client
word = win32com.client.Dispatch('Word.Application')
doc = word.Documents.Add('example.html')
doc.SaveAs('example.doc', FileFormat=0)
doc.Close()
word.Quit()