Python使用重新匹配用长tex悬挂

2条回答

网友

1楼 · 编辑于 2024-04-25 06:42:02

为了避免灾难性的回溯，可以简化正则表达式：

import re

with open("domains.txt") as file:
    text = file.read()
main_domain = "happy.com"
subdomains = re.findall(r"^(.+)\.%s$" % re.escape(main_domain), text, re.M)

如果您还想匹配主域：^{}。在

网友

2楼 · 编辑于 2024-04-25 06:42:02

(.*\.)*很可能导致可怕的回溯。如果文件每行包含一个域，最简单的修复方法是在每行上执行regex，而不是同时执行整个文件：

main_domain = 'happy.com'
for line in open('domains.txt','r')):
    matchobj = re.match(r'^(.*\.)*%s$' % main_domain, line.strip())
    # do something with matchobj

如果您的文件中除了域以外没有其他内容，您甚至可以简化这些内容，而不使用正则表达式：

^{pr2}$

编程相关推荐

java获取TaskCompletionSource工作（Firestore的Android任务）
从PNG文件获取java或信息
neo4j嵌入式版本2.3.8的java NotInTransactionException
OSGI框架的java Eclipse启动配置在Mac上不起作用
java svn:“预提交”挂钩失败，输出错误：
java中ResourceBundle的io查询
java声明变量的最佳方法是什么？遵循下面的例子？
java如何在log4j中获得不同的记录器？
hibernate错误“java.lang.NoSuchMethodError:org.jboss.logging.Logger.getMessageLogger”
swing将JPanel保存为图像

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python使用重新匹配用长tex悬挂

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >