Python collective.soupstrainer包_程序模块 - PyPI

使用beautifulsoup和filter规则清理html。

collective.soupstrainer的Python项目详细描述

集合。Soupstrainer

经常需要从某些源代码中清理html，不管是用户输入或数据收集的刮削，这需要清理。与集体中的Soupstrainer类。Soupstrainer这很简单。它使用美化outsoup4来解析和清理html。类的构造函数接受四个论点。

除外条款: 这是一个元组列表，每个元组有两个项。第一项是标记名，第二项是属性列表。如果列表属性为空，则第一个列表中的每个标记都是完全的从传入的HTML中删除。如果标记列表为空，则每个已完全删除列出的属性。如果同时有标签和列出属性，则仅从匹配中移除属性标签。
样式白名单: 这是“style”属性中允许的css样式的白色列表。全部其他样式将被删除。
U类黑名单: 这是css类的黑名单。每个匹配的类都从 “类”属性。
分析器: 这是beautifulsoup4使用的解析器，当使用一根绳子。它必须是为美化组4安装的解析器，默认为 html.parser

soupstrainer类的实例可以直接用一个争论。参数可以是字符串，在这种情况下内部由beautifulsoup4解析，结果将是unicode（或 python 3中的字符串），或者它可以是由beautifulsoup4创建的解析html树，在这种情况下，它将被就地修改并再次返回。

更改日志

2.1（2019-02-06）

添加对python 3和pypyy的支持。

2.0（2017-10-19）

向后不兼容的更改
更新以美化组4。
将参数`parser`添加到指定解析器的`SoupStrainer`中用于美化组4。

1.0-2008年11月14日

初始版本

欢迎加入QQ群-->： 979659372

collective.soupstrainer 2.1

collective.soupstrainer的Python项目详细描述

集合。Soupstrainer

更改日志

2.1（2019-02-06）

2.0（2017-10-19）

向后不兼容的更改
更新以美化组4。
将参数`parser`添加到指定解析器的`SoupStrainer`中用于美化组4。

1.0-2008年11月14日

推荐PyPI第三方库

buslib

django-xapp-render

bio-jtools

autotweet

odoo8-addon-field-rrule

bitwarden-simple-cli

pymatbridge

toga-curses

Ghost.p

XStatic-JQuery.quicksearch

MySpace

Flask-WX-OAuth

reqREST

abo-generator

expiringdict-with-default

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

collective.soupstrainer 2.1

collective.soupstrainer的Python项目详细描述

集合。Soupstrainer

更改日志

2.1（2019-02-06）

2.0（2017-10-19）

向后不兼容的更改 更新以美化组4。将参数parser添加到指定解析器的SoupStrainer中 用于美化组4。

1.0-2008年11月14日

推荐PyPI第三方库

buslib

django-xapp-render

bio-jtools

autotweet

odoo8-addon-field-rrule

bitwarden-simple-cli

pymatbridge

toga-curses

Ghost.p

XStatic-JQuery.quicksearch

MySpace

Flask-WX-OAuth

reqREST

abo-generator

expiringdict-with-default

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

向后不兼容的更改
更新以美化组4。
将参数`parser`添加到指定解析器的`SoupStrainer`中用于美化组4。

导航栏

项目链接

标签