Динамическое регулярное выражение в Ruby - PullRequest
7 голосов
/ 01 августа 2009

Я пытаюсь найти способ, позволяющий мне динамически создавать объект регулярного выражения из строки (взятой из базы данных), а затем использовать ее для фильтрации другой строки. Этот пример предназначен для извлечения данных из сообщения git commit, но теоретически любое допустимое регулярное выражение может присутствовать в базе данных в виде строки.

Что происходит

>> string = "[ALERT] Project: Revision ...123456 committed by Me <me@me.com>\n on 2009-   07-28 21:21:47\n\n    Fixed typo\n"
>> r = Regexp.new("[A-Za-z]+: Revision ...[\w]+ committed by [A-Za-z\s]+")
>> string[r]
=> nil

Что я хочу, чтобы произошло

>> string = "[ALERT] Project: Revision ...123456 committed by Me <me@me.com>\n on 2009-   07-28 21:21:47\n\n    Fixed typo\n"
>> string[/[A-Za-z]+: Revision ...[\w]+ committed by [A-Za-z\s]+/]
=> "Project: Revision 123456 committed by Me"

Ответы [ 2 ]

11 голосов
/ 01 августа 2009

Вам не хватает только одного:

>> Regexp.new "\w"
=> /w/
>> Regexp.new "\\w"
=> /\w/

Обратные слэши - это экранирующие символы в строках. Если вы хотите буквальную обратную косую черту, вы должны удвоить ее.

>> string = "[ALERT] Project: Revision ...123456 committed by Me <me@me.com>\n on 2009-   07-28 21:21:47\n\n    Fixed typo\n"
=> "[ALERT] Project: Revision ...123456 committed by Me <me@me.com>\n on 2009-   07-28 21:21:47\n\n    Fixed typo\n"
>> r = Regexp.new("[A-Za-z]+: Revision ...[\\w]+ committed by [A-Za-z\\s]+")
=> /[A-Za-z]+: Revision ...[\w]+ committed by [A-Za-z\s]+/
>> string[r]
=> "Project: Revision ...123456 committed by Me "

Как правило, если бы вы вставили выходные данные из ваших "ломаных" строк, а не просто из ввода, вы, вероятно, заметили, что w и s не были экранированы правильно

0 голосов
/ 01 августа 2009

Вариант 1:

# Escape the slashes:
r = Regexp.new("[A-Za-z]+: Revision ...[\\w]+ committed by [A-Za-z\\s]+")

Недостаток: вручную уберите всех известных escape-символов

Вариант 2:

# Use slashes in constructor
r = Regexp.new(/[A-Za-z]+: Revision ...[\w]+ committed by [A-Za-z\s]+/)

Недостаток: нет

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...