为什么正则表达式关于芬德尔（）不起作用？

src="/advjs/gg728x90.js"></script></td> </tr></table><div class="text" align="justify"></p><p> Sure. Eye of newt. Tongue of snake.</p><p> She added, “Since you’re taking Skills for Living, it’ll be good practice.”</p><p> For what? I wondered. Poisoning my family? “I have to baby-sit,” I said, a little too gleefully.</p>

1条回答

网友

1楼 · 发布于 2024-04-16 11:09:01

我强烈建议您使用合适的HTML解析器，如BeautifulSoup：

from bs4 import BeautifulSoup

soup = BeautifulSoup(Luna.read())
para_strings = (p.get_text() for p in soup.find_all('p'))
txt = [p.strip() for p in para_strings if p.startswith(' ')]

您可以通过使用非贪婪操作符来修复regex（在*操作符后面附加一个?问号）：

txt=re.findall('<p>\s+(.*?)</p>',text)

但是，您很可能会遇到regex解析的其他问题，因为HTML不是一种常规语言。你知道吗

编程相关推荐

Java：在新文件（）中传递字符串变量；
java正则表达式模式匹配器失败
反射“特殊属性/属性”，而不是Java中的getter/setter，以避免锅炉板代码
java“NoSuchMethodError”是什么意思？
java文件名、目录名或卷标语法不正确Kotlin Maven
使用java查找主机名时，性能线程进入阻塞状态。网地址。getLocalHost
java如何解决此连接配置强制转换异常？
java我不确定如何将我当前基于lwjgl的引擎与Jbox2D结合使用
在这个mergesort实现中，每次都会调用java合并
Java避免传递已检查的异常

相关问题更多 >

编程相关推荐

热门问题

热门文章

为什么正则表达式关于芬德尔（）不起作用？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >