白名单HTML过滤器
htmlfilter的Python项目详细描述
关于
非常简单的白名单HTML过滤器。
与客户端的所见即所得编辑器一起使用。
用法
- ::
- 从htmlfilter导入htmlfilter hf=htmlfilter() 已清理的HTML=hf.filter(脏的HTML)
规则文件
过滤器是用一组预定义的规则实例化的。 http://github.com/samueladam/htmlfilter/blob/master/htmlfilter/rules.py
您可以创建自己的规则文件:
# file: my_rules.py TAGS = { 'a': ('href', 'name',), 'p': ('class',), } # define filters on attributes data (tag_attr) def p_class(data): if data not in ('class1', 'class2',): data = '' return data
并以这种方式使用:
from htmlfilter import HTMLFilter import my_rules hf = HTMLFilter(rules=my_rules) cleaned_html = hf.filter(dirty_html)