用于html tidy(tidylib)的python包装器,与python 2和3兼容

pytidylib6的Python项目详细描述


0.2.0:在Windows上工作!有关可用的dll下载,请参阅文档 位置。重写和扩展文档。

PyTidyLib是包装HTML Tidy库的python包。这个 允许您从python代码“修复”无效(x)html标记。一些 库的许多功能包括:

  • 清除未关闭的标记和未转换的字符,如与号
  • 输出HTML 4或XHTML,严格的或过渡的,并添加缺少的文档类型
  • 将命名实体转换为数字实体,然后可以在XML中使用 没有HTML文档类型的文档。
  • 清除Word等程序中的HTML(在一定程度上)
  • 缩进输出,包括pre元素的正确缩进(即否), 一些(x)html缩进代码忽略了这一点。

使用小示例

以下代码将清除无效的HTML文档并设置一个选项:

from tidylib import tidy_document
document, errors = tidy_document('''<p>f&otilde;o <img src="bar.jpg">''',
  options={'numeric-entities':1})
print document
print errors

文档

文档随源发行版一起提供,可在 网页PyTidyLib

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Admob不使用webview   Java Wicket表单:序列化对象类“myClassName”时出错   java googledriveapi更新文件与我的帐户管理员   java简单框架未知xml标记解析   java如何使用主类和用户获取Spark应用程序ID   java如何更改自定义属性的值?   java有没有办法在jMock中找到未使用的期望值?   gradle运行任务的java文档?   java通过使用数组来存储文本文件的行,通过覆盖来删除文本文件中的行   用于表达式语言注入的java利用负载   java IDEStyle程序运行   java在运行时启用/禁用Springws   爪哇芦苇。formatNumber NullPointException   java为什么我的代码无法检测两个动态实体之间的碰撞?