Мне нужно написать регулярные выражения для соответствия некоторому токенизируемому тексту, и будет сложнее добавить все \s*
и \s+
, если количество пробелов незначительно или совсем не требуется.
Я хотел бы иметь функцию, которая принимает регулярное выражение и список токенов-разделителей, а затем добавляет для меня подходящие пробелы.
Например:
make_whitespace(regex="foo\.(\w+)\(a\)",delimiters="()[]{},.+-")
должен вернуть
"foo\s*\.\s*(\s*\w+\s*)\(\s*a\s*\)"
Возможно, уже есть лучший способ добиться этого, чем взломать существующее регулярное выражение;но я думаю, что использование полного генератора парсера было бы излишним.Я использую Python.
Спасибо.