找到写得不好的正则表达式

2024-06-12 08:13:35 发布

您现在位置:Python中文网/ 问答频道 /正文

为了帮助我学习regex,我正在尝试改进现有的regex,这些regex都是用糟糕的性能编写的。你知道吗

阅读https://www.loggly.com/blog/five-invaluable-techniques-to-improve-regex-performance

here are five regular expression techniques that can dramatically reduce processing time:

Character classes
Possessive quantifiers (and atomic groups)
Lazy quantifiers
Anchors and boundaries
Optimizing regex order

为了自动化查找性能不佳的regex的过程,我正在考虑编写一个脚本,使用上述规则检查每个regex。例如,搜索[]以检查每个正则表达式中的字符类。如果正则表达式不包含字符类,那么它可能是性能优化的候选对象。你知道吗

有没有其他基于规则的方法可以用来检查regex的性能。你知道吗

或者可能有一个Java/Python库当前实现了这个功能?你知道吗


Tags: andtohttpscom规则wwwblog性能