Python中文
首页
教程
问答
标签
搜索
登录
注册
正则表达式永远在短字符串上。
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我在看一堆字符串,试图用下面的模式匹配一些。你知道吗</p> <pre><code>location_pattern = re.compile( r""" \b (?P<location> ([A-Z]\w*[ -]*)+[, ]+ ( [A-Z]{2} | [A-Z]\w+\ *\d ## ) ) \b """, flags=re.VERBOSE) </code></pre> <p>现在,这个regex在我的几乎所有数据集上都可以运行,但是在这个<em>特定字符串上需要<strong>永远<strong>(好的,5秒):</p> <pre><code>' JAVASCRIPT SOFTWARE ARCHITECT, SUCCESSFUL SERIAL' </code></pre> <p>在我的输入数据的某个点上有一堆这样的字符串(所有的大写字母,很多空格字符),程序在点击它时会大大减慢速度。我试着取出正则表达式的不同部分,结果发现罪魁祸首是<br/> <strong>\*\d</strong>在注释行的末尾。你知道吗</p> <p>我想了解这是如何导致regex验证花费这么长时间的。你知道吗</p> <p>有人能帮忙吗?你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>除了格雷格的回答,你还有一个模式:</p> <pre><code>([A-Z]\w*[ -]*)+ ^ ^-^ Note embedded quantifiers! </code></pre> <p>在重复的组中使用量词(更糟糕的是你有两个量词)通常会产生灾难性的回溯问题。因此,我会重新考虑正则表达式。你知道吗</p> <p>注释:如果您稍后通过更新我的答案添加更多示例数据和预期输出,我可以为您提供另一个regex。你知道吗</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
我是否正确构建了这个递归神经网络
10 回答
我是否正确理解acquire和realease是如何在python库“线程化”中工作的
8 回答
我是否正确理解Keras中的批次大小?
8 回答
我是否正确理解PyTorch的加法和乘法?
9 回答
我是否正确组织了我的Django应用程序?
1 回答
我是否正确计算执行时间?如果是这样,那么并行处理将花费更长的时间。这看起来很奇怪
10 回答
我是否每次创建新项目时都必须在PyCharm中安装numpy?(安装而不是导入)
3 回答
我是否每次运行jupyter笔记本时都必须重新启动内核?
5 回答
我是否用python安装了socks模块?
9 回答
我是否真的需要知道超过一种语言,如果我想要制作网页应用程序?
5 回答
我是否缺少spaCy柠檬化中的预处理功能?
6 回答
我是否缺少给定状态下操作的检查?
6 回答
我是否能够使用函数“count()”来查找密码中大写字母的数量((Python)
7 回答
我是否能够使用用户输入作为colorama模块中的颜色?
5 回答
我是否能够创建一个能够添加新Django.contrib.auth公司没有登录到管理面板的用户?
7 回答
我是否能够将来自多个不同网站的数据合并到一个csv文件中?
4 回答
我是否能够将目录路径转换为可以输入python hdf5数据表的内容?
7 回答
我是否能够等到一个对象被销毁,直到它创建另一个对象,然后在循环中运行time.sleep()
5 回答
我是否能够通过CBV创建用户实例,而不是首先创建表单?(Django)
4 回答
我是否要使它成为递归函数?
7 回答