白名单HTML过滤器

htmlfilter的Python项目详细描述


关于

非常简单的白名单HTML过滤器。

与客户端的所见即所得编辑器一起使用。

用法

::
从htmlfilter导入htmlfilter hf=htmlfilter() 已清理的HTML=hf.filter(脏的HTML)

规则文件

过滤器是用一组预定义的规则实例化的。 http://github.com/samueladam/htmlfilter/blob/master/htmlfilter/rules.py

您可以创建自己的规则文件:

# file: my_rules.py
TAGS = {
        'a': ('href', 'name',),
        'p': ('class',),
}

# define filters on attributes data (tag_attr)
def p_class(data):
    if data not in ('class1', 'class2',):
        data = ''
    return data

并以这种方式使用:

from htmlfilter import HTMLFilter
import my_rules

hf = HTMLFilter(rules=my_rules)
cleaned_html = hf.filter(dirty_html)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java无法启动应用程序:JNLP错误   java根据用户输入在PreparedStatement中使用setTime()或setNull()   java EJB与同步   java以object为键通过hashmap进行搜索   java中的模10^9+7   针对包含其他对象的对象的java OOP最佳实践   如何将字符串作为HTML代码从Java文件读取到JSP页面?   java我的POM怎么了?“解析表达式..检测到递归表达式循环”   用于Hbase的Mapreduce的java NoSuchMethodError   JAVAlang.SecurityException:权限拒绝:启动意图{act=安卓.Intent.action.MAIN cat=[安卓.Intent.category.LAUNCHER]   数组初始化谜语Java   通过arraylist搜索时的java句柄关联