Python使用regex删除HTMLtag

<section class="realestate oca"></section> <script type="text/javascript" data-type="ad"> window.addEventListener('DOMContentLoaded', function(){ window.postscribe && postscribe(document.querySelector(".realestate"), '<script src="https://ocacache-front.schibsted.tech/public/dist/oca-loader/js/ocaloader.js?type=re&w=100%&h=300"><\/script>'); }); </script>

1条回答

网友

1楼 · 发布于 2024-06-09 00:25:58

第一个regex不起作用，因为字符类（[...]）是一个字符集合，而不是字符串。因此，只有当它发现<script与</script>之间由一个不包括<、/、s、c等的字符串分隔的{}与{}分隔

第二个regex更好，它不能工作的唯一原因是默认情况下，.通配符与换行符不匹配。要告诉它您想要它，您需要添加^{}标志：

re.sub(r'<script.+?</script>', '', text, flags=re.DOTALL)

编程相关推荐

JAVAexists（）方法始终返回false
java SNMP4J v2c陷阱发送速度非常慢
java计算给定单词中字母的频率
在java中执行curl命令获取异常
java按下按钮时，应显示一个数字，并在日期选择器处计数
java递归将括号设置为字符串字符
节点。java中AWS IOT按钮的js Lambda函数
删除ArrayList中的所有空格。JAVA
java我可以在eclipse中定义一个显示html文件的视图吗？
java为什么RestController公开Crudepository中的所有操作？

相关问题更多 >

编程相关推荐

热门问题

热门文章