将HTML转换为降价

html2txt的Python项目详细描述


HTML2XT

html2text将HTML转换为markdown。在

使用

导入模块。在

fromhtml2txtimportconverters

对HTML文本调用Html2Markdown转换器将其转换为markdown。在

^{pr2}$

运行转换器进行单元测试

> cd html2txt/converters
> python3 -B html2markdown.py --path path-to-html-directory

测试

创建虚拟环境

> cd html2txt

> python3 -m venv venv

> source ./venv/bin/activate

进行测试

CommonmarkBreakdance测试是为将markdown转换成HTML而编写的,因此许多测试由于空格和markdown表示方式的选择不同而失败。在

Breakdance由降价编辑器Dillinger使用。在

> cd html2txt/tests

> python3 -B ./config/mkhtml2txt.py --path .

> python3 -B ./config/mkcommonmark.py --path .

> python3 -B ./config/mkbreakdance.py --path .

> python3 -B ./config/mksvgweb.py --path .

> python3 -B ./config/mkmathml.py --path .

运行测试

> pytest -vv

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何修复尝试将用户签名到服务器主机时出现的“字符串无法转换为json对象”错误?   控制台Java:不使用新行更新命令行中的文本   java servlet接收xml数据时,出现错误   使用REST API在Bitbucket中复制或复制存储库   java如何在JavaFX中对齐一行?   java如何在活动中显示通过服务获得的数据?   返回BigDecimal作为字符串:返回int   java组织。openqa。硒。InvalidSelectorException:尝试查找元素时选择器无效   java仅在阻塞状态下通知和通知所有影响线程   java JBOSS无法启动部署   java方法的返回值能保证类型安全吗?   JavaeShadoop序列化组织。阿帕奇。hadoop。木卫一。短写失败   java如果我在同一个类上同步了两个方法,它们能同时运行吗?   不使用java数据库的spring分页实现   java如何将字符串切碎成这样的数组?