背面口袋的regex食谱
re101的Python项目详细描述
#RE101
一个常用正则表达式的概要。
这个包特别适用于嵌入在python中并使用python的[`re`](https://docs.python.org/3/library/re.html)模块编译的正则表达式。
----
例如,“us_phonenum”匹配遵循北美数字计划(NANP)格式的序列。用通俗的英语来说,这就是所谓的“北美电话号码”:
```python
>;>;从RE101导入美国电话号码
>;>;text=“
…罗斯·麦克弗夫:+1(834)345.1254 155 Elm Street
…罗纳德·希斯莫尔:芬利大道892-345-3428 436号。法兰克汉堡:541-7625 662 South Dogwood Way
…Heather Albrecht:5483264584 919 Park Place“
>>>美国电话号码Findall(文本)
['+1(834)345.1254','892-345-3428','541-7625','5483264584']
```
该包支持与以下内容相关的正则表达式:
-电子邮件地址
-空白
-字/令牌
-电话号码
-IP地址
-URL
-整数、小数,数字
-地理信息
-个人识别信息
这是“re.compile()”的结果。
-`camelcase`:这些类的`\uu new\uuuuuuu()`方法返回已编译的正则表达式,但接受一些额外的参数,这些参数为已编译的结果添加可选性。例如,“number”类允许或不允许前导零和逗号。
-“小写”:这些是围绕包的regex常量构建的传统函数。它们在调用语法或结果类型上没有任何一致性。
它们中的任何一个都不太可能涵盖它们打算涵盖的100.00%的案件。它们是用来处理“99.x%”的案件的。对于所有正则表达式,必须做到平衡:覆盖增量0.1%的情况通常需要大量的工作和代码。
如果您确实注意到严重的错误或遗漏,请考虑提交问题或请求。请参阅“贡献”文件。
请假定这些表达式是“以美国为中心”的,除非另有说明。例如,`zip codes`表达式只查找xxxxx或xxxxx-xxxx邮政编码。
在这里,可以从多个公共源中以类似形式找到的更多“通用”regex不能引用。
1。Goyvaerts,Jan和Steven Levithan。《正则表达式食谱》,第2版。塞巴斯托波尔:奥雷利,2012。
2。弗里德尔,杰弗里。《掌握正则表达式》,第三版。塞巴斯托波尔:奥雷利,2009。
3。goyvaerts,一月。正则表达式:完整教程。https://www.regular-expressions.info/
4.org文档:“re”模块。https://docs.python.org/3/library/re.html
5.Kuchling,A.M.“正则表达式howto”,https://docs.python.org/3/howto/regex.html
6.org文档:“ipaddress”模块。版权所有2007谷歌公司根据出资人协议授权给PSF。https://docs.python.org/3/library/ipaddress.html
7.nerdssaveme/regex.txt。https://gist.github.com/nerdssecume/1237767
和标点符号)
一个常用正则表达式的概要。
这个包特别适用于嵌入在python中并使用python的[`re`](https://docs.python.org/3/library/re.html)模块编译的正则表达式。
----
例如,“us_phonenum”匹配遵循北美数字计划(NANP)格式的序列。用通俗的英语来说,这就是所谓的“北美电话号码”:
```python
>;>;从RE101导入美国电话号码
>;>;text=“
…罗斯·麦克弗夫:+1(834)345.1254 155 Elm Street
…罗纳德·希斯莫尔:芬利大道892-345-3428 436号。法兰克汉堡:541-7625 662 South Dogwood Way
…Heather Albrecht:5483264584 919 Park Place“
>>>美国电话号码Findall(文本)
['+1(834)345.1254','892-345-3428','541-7625','5483264584']
```
该包支持与以下内容相关的正则表达式:
-电子邮件地址
-空白
-字/令牌
-电话号码
-IP地址
-URL
-整数、小数,数字
-地理信息
-个人识别信息
这是“re.compile()”的结果。
-`camelcase`:这些类的`\uu new\uuuuuuu()`方法返回已编译的正则表达式,但接受一些额外的参数,这些参数为已编译的结果添加可选性。例如,“number”类允许或不允许前导零和逗号。
-“小写”:这些是围绕包的regex常量构建的传统函数。它们在调用语法或结果类型上没有任何一致性。
它们中的任何一个都不太可能涵盖它们打算涵盖的100.00%的案件。它们是用来处理“99.x%”的案件的。对于所有正则表达式,必须做到平衡:覆盖增量0.1%的情况通常需要大量的工作和代码。
如果您确实注意到严重的错误或遗漏,请考虑提交问题或请求。请参阅“贡献”文件。
请假定这些表达式是“以美国为中心”的,除非另有说明。例如,`zip codes`表达式只查找xxxxx或xxxxx-xxxx邮政编码。
在这里,可以从多个公共源中以类似形式找到的更多“通用”regex不能引用。
1。Goyvaerts,Jan和Steven Levithan。《正则表达式食谱》,第2版。塞巴斯托波尔:奥雷利,2012。
2。弗里德尔,杰弗里。《掌握正则表达式》,第三版。塞巴斯托波尔:奥雷利,2009。
3。goyvaerts,一月。正则表达式:完整教程。https://www.regular-expressions.info/
4.org文档:“re”模块。https://docs.python.org/3/library/re.html
5.Kuchling,A.M.“正则表达式howto”,https://docs.python.org/3/howto/regex.html
6.org文档:“ipaddress”模块。版权所有2007谷歌公司根据出资人协议授权给PSF。https://docs.python.org/3/library/ipaddress.html
7.nerdssaveme/regex.txt。https://gist.github.com/nerdssecume/1237767
和标点符号)