在现有PDF文件上呈现HTML覆盖

htmloverpdf的Python项目详细描述


一个用于http://weasyprint.org/的包装器,它允许与现有的PDF文件组合。

api:呈现(html)输入是html字符串,输出是pdf字节。

对于weasyprint,它需要cairocairocffi等,这就增加了读取pdf的poppler。最好通过软件包管理器安装:

apt install python3-gi-cairo gir1.2-poppler-0.18 python3-cairocffi python3-lxml gir1.2-pango-1.0

它解析html,查找以src url结尾的“.pdf”标记。每个页面开始一个新页面,并复制覆盖weasyprint输出的所有源页面。 神奇的值“blank.pdf”无需覆盖即可输出部分HTML。

python -m htmloverpdf < test.html > test.pdf

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
utf 8如何从JAVA中的UTF8代码中获取主要字符?   使用AsyncTask和重启方法的java   java如何从firebase中删除?   java搜索非二叉树中的任何节点,即使找到多个节点,也保持它们的父节点完好无损   java如何获取只有迭代器的列表的“切片”?   在Java中,多线程是作为线程安全的方法参数的方法引用   java Eclipse Maven构建:缺少自己项目的需求   java Androidsocket客户端不工作   java从JPanel中动态删除组件   带有进度侦听器的java GWT文件上载   JAVANoClassDefFoundError:javax/mail/Authenticator,怎么了?   java如何在会话中存储检索到的对象,并在会话结束后访问它?   java MQTT和Junit正在寻找嵌入式MQTT代理   用于空键的java流groupBy收集器和分组值列表上的应用收集器