Существует ли библиотека для генерации данных в соответствии с регулярным выражением? (Python или другое) - PullRequest
8 голосов
/ 13 августа 2010

Учитывая регулярное выражение, я хотел бы сгенерировать случайные данные x количество раз, чтобы что-то проверить.

, например

>>> print generate_date('\d{2,3}')
13
>>> print generate_date('\d{2,3}')
422

Конечно, цель состоит в том, чтобы сделать что-то более сложное, например, номера телефонов и адреса электронной почты.

Существует ли что-то подобное? Если это так, существует ли он для Python? Если нет, какую-нибудь подсказку / теорию, которую я мог бы использовать для этого?

Ответы [ 3 ]

8 голосов
/ 13 августа 2010

Pyparsing включает этот инвертор регулярных выражений , который возвращает генератор всех перестановок для простых регулярных выражений. Вот несколько тестов из этого модуля:

[A-C]{2}\d{2}
@|TH[12]
@(@|TH[12])?
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9]))?
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9])|OH(1[0-9]?|2[0-9]?|30?|[4-9]))?
(([ECMP]|HA|AK)[SD]|HS)T
[A-CV]{2}
A[cglmrstu]|B[aehikr]?|C[adeflmorsu]?|D[bsy]|E[rsu]|F[emr]?|G[ade]|H[efgos]?|I[nr]?|Kr?|L[airu]|M[dgnot]|N[abdeiop]?|Os?|P[abdmortu]?|R[abefghnu]|S[bcegimnr]?|T[abcehilm]|Uu[bhopqst]|U|V|W|Xe|Yb?|Z[nr]
(a|b)|(x|y)

Edit:

Чтобы сделать ваш случайный выбор, создайте список (один раз!) Ваших перестановок и затем вызывайте random.choice в списке каждый раз, когда вы хотите получить случайную строку, соответствующую регулярному выражению, что-то вроде этого (непроверенное):

class RandomString(object):
    def __init__(self, regex):
        self.possible_strings = list(invRegex.invert(regex))
    def random_string(self):
        return random.choice(self.possible_strings)
2 голосов
/ 13 августа 2010

В списке рассылки Python есть сообщение о модуле, который генерирует все перестановки регулярного выражения.Я не совсем уверен, как вы могли бы сделать это случайным образом.Я буду продолжать проверять.

1 голос
/ 13 августа 2010

Вероятно, меня будут выпороть за это, но в Perl есть модуль, который делает именно это. Возможно, вы захотите взглянуть на код, как реализовать его в Python:

http://p3rl.org/String::Random

...