如何用空白替换文本中提取的HTML标记？

2024-05-29 00:07:12 发布

男 | 程序猿一只，喜欢编程写python代码。

我从一个没有所有标签的html页面中提取文本（使用Python和BeautifulSoup）。但是，标记不会替换为空白。例如，对于“blah blahDIVTAGblah”，我得到下面的文本“blah blahblah”。我怎样才能在第二个和第三个废话之间插入空白？我正在使用下面的代码。你知道吗

# kill all script and style elements
    for script in soup(["script", "style"]):
        script.extract()

代码来自BeautifulSoup Grab Visible Webpage Text

Tags：代码标记文本 style html script 页面标签

1条回答

网友

1楼 · 发布于 2024-05-29 00:07:12

只需使用^{}将标记替换为空白：

for script in soup(["script", "style"]):
    script.replace_with(" ")

编程相关推荐

java如何使用相同的模型、颜色、字体和侦听器创建JTable的副本？
JavaSpring+Thymeleaf：用户时区中的时间
java HTTP请求返回非法状态异常安卓
java xml验证JDK 1.5 JDK 1.6差异
junit如何使用Parasoft从java文件生成测试文件
java使用getSpans方法获取可扩展文件中的所有跨距
javascript无法使用bindingResult设置表单元素
java RCP应用程序活动
获取Java类中泛型字段的类型
java更新查询，从一个依赖于另一个表的表中更改字段

热门问题

Django:。是不是“超级用户”字段不起作用
5 个回答
Django:'DeleteQuery'对象没有属性'add'
2 个回答
Django:'ModelForm'对象没有属性
4 个回答
Django:'python manage.py runserver'返回'TypeError:'WindowsPath'类型的对象没有len（）
4 个回答
Django:'Python管理.pysyncdb'不创建我的架构表
10 个回答
Django:'Python管理.py迁移“耗时数小时（和其他奇怪的行为）
4 个回答
Django:'readonly'属性在我的ModelForm上不起作用
10 个回答
Django:'RegisterEmployeeView'对象没有属性'object'
2 个回答
Django:'str'对象没有属性'get'
6 个回答
Django：'创建' 不能被指定为Order模型表单中的值，因为它是一个不可编辑的字段
5 个回答
Django:“'QuerySet'类型的对象不是JSON可序列化的”
9 个回答
Django:“'utf8'编解码器无法解码位置19983中的字节0xe9：无效的连续字节”，加载临时文件时
11 个回答
Django:“<…>”需要有一个字段“id”的值，然后才能使用这个manytomy关系
8 个回答
Django:“AnonymousUser”对象没有“get_full_name”属性
1 个回答
Django:“ascii”编解码器无法解码位置1035中的字节0xc3：序号不在范围内（128）
1 个回答
Django:“BaseTable”对象不支持索引
11 个回答
Django:“collections.OrderedDict”对象不可调用
3 个回答
Django:“Country”对象没有属性“all”
3 个回答
Django:“Data”对象没有属性“save”
6 个回答
Django:“datetime”类型的对象不是JSON serializab
7 个回答

如何用空白替换文本中提取的HTML标记？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何用空白替换文本中提取的HTML标记？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >