python模块,通过保持html标记的原样来帮助剪切html字符串
htmlcutstring的Python项目详细描述
很容易提取具有给定长度限制的文本字符串的摘录。但是 如果要从HTML中摘录,则可能存在于文本中的标记。 弦使它更复杂。
本模块提供了一个解决方案,可以使用 给定文本长度限制,不计算任何HTML标记的长度。
此包用于剪切具有HTML标记的字符串。 它不计算html标记,只计算标记中的字符串并保持 现在的标签。
例如:如果字符串是“欢迎使用<;b>;python world<;/b>;<;br/>;python is bla”。如果 我们想剪掉16个字符的字符串,然后输出将是“欢迎使用 &“Python”。
在这里切割绳子时,它会保留切割绳子和跳绳的标签 剩下的部分,而不破坏div结构。
- 用法1:
obj=htmlcutstring(“欢迎来到<;b>;python world<;b>;<;br/>;python is”,16)
newcutstring=obj.cut()
- 用法2:
- newcutstring=cuthtmlstring(“欢迎来到<;b>;python world<;b>;<;br/>;python is”,16)