python模块,通过保持html标记的原样来帮助剪切html字符串

htmlcutstring的Python项目详细描述


很容易提取具有给定长度限制的文本字符串的摘录。但是 如果要从HTML中摘录,则可能存在于文本中的标记。 弦使它更复杂。

本模块提供了一个解决方案,可以使用 给定文本长度限制,不计算任何HTML标记的长度。

此包用于剪切具有HTML标记的字符串。 它不计算html标记,只计算标记中的字符串并保持 现在的标签。

例如:如果字符串是“欢迎使用<;b>;python world<;/b>;<;br/>;python is bla”。如果 我们想剪掉16个字符的字符串,然后输出将是“欢迎使用 &“Python”。

在这里切割绳子时,它会保留切割绳子和跳绳的标签 剩下的部分,而不破坏div结构。

用法1:

obj=htmlcutstring(“欢迎来到<;b>;python world<;b>;<;br/>;python is”,16)

newcutstring=obj.cut()

用法2:
newcutstring=cuthtmlstring(“欢迎来到<;b>;python world<;b>;<;br/>;python is”,16)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java JPA。Eclipselink没有为mySQL提供密码,但它应该提供   我的Servlet和@FormDataParam存在java问题   java将什么作为上下文参数传递到文件I/O方法中?   如果两个值相同,java无法找到其中一个单选按钮   java在变量和方法名中使用下划线   JavaSpringMVC单线程安全?   klazz类的java Arraylist(反射Api)   java如何在数字字符串中查找最频繁的数字?   JavaAPI设计:使数据更易于阅读与强制更多API调用   JavaHadoopMapReduceforGoogleWebGraph   java无法启动gauge API:Runner意外退出   java如何在bluemix上使用ibm工作负载调度器?   拉取一年中某一周特定日期的所有日期   java为什么是我的角节点。js应用程序将图像上传到S3� 邮递员正确上传时的符号?   在不使用任何第三方jar的情况下将文件从本地传输到linux系统(java代码)   java将现有文件夹复制到Eclipse工作区中新创建的项目中   Java中的regex RegExp帮助   当使用“系统”外观时,Java组合框setSelectedItem会出现故障   JavaASM:在类的方法中获取局部变量名和值