有没有库可以根据正则表达式生成数据?(Python或其他)
给定一个正则表达式,我想生成随机数据,次数可以自己设定,以便测试一些东西。
比如说:
>>> print generate_date('\d{2,3}')
13
>>> print generate_date('\d{2,3}')
422
当然,我的目标是做一些比这更复杂的事情,比如生成电话号码和电子邮件地址。
有没有类似的工具?如果有的话,Python中有没有?如果没有,有什么思路或者理论可以用来实现这个吗?
3 个回答
2
在Python的邮件列表上,有一篇帖子提到一个模块,可以生成正则表达式的所有排列组合。不过,我不太确定怎么去让这些排列组合变得随机一些。我会继续关注这个话题。
2
我可能会因为这个建议而被骂,但perl有一个模块可以完全做到这一点。你可以看看这个代码,了解如何在python中实现:
8
Pyparsing 包含了一个 正则表达式反转器,它可以生成所有简单正则表达式的排列组合。下面是这个模块的一些测试案例:
[A-C]{2}\d{2}
@|TH[12]
@(@|TH[12])?
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9]))?
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9])|OH(1[0-9]?|2[0-9]?|30?|[4-9]))?
(([ECMP]|HA|AK)[SD]|HS)T
[A-CV]{2}
A[cglmrstu]|B[aehikr]?|C[adeflmorsu]?|D[bsy]|E[rsu]|F[emr]?|G[ade]|H[efgos]?|I[nr]?|Kr?|L[airu]|M[dgnot]|N[abdeiop]?|Os?|P[abdmortu]?|R[abefghnu]|S[bcegimnr]?|T[abcehilm]|Uu[bhopqst]|U|V|W|Xe|Yb?|Z[nr]
(a|b)|(x|y)
编辑:
如果你想随机选择,可以先创建一个包含所有排列组合的列表(只需做一次!),然后每次想要一个符合正则表达式的随机字符串时,就调用 random.choice
从这个列表中选一个,像这样(未测试):
class RandomString(object):
def __init__(self, regex):
self.possible_strings = list(invRegex.invert(regex))
def random_string(self):
return random.choice(self.possible_strings)