Возникли проблемы при переводе поведения регулярного выражения из python в AWK - PullRequest
0 голосов
/ 12 марта 2019

Я пытаюсь сделать что-то вроде следующего (написанного на python), но в awk, но у меня возникают проблемы с его работой

new_row=re.sub(r'(.)\1{5,}', r'\1', row)

По сути, я хочу иметь возможность заменить экземпляры повторяющихся последовательных символов(5 или более) в один.Мне нужно иметь возможность установить, сколько экземпляров одного символа вызывает регулярное выражение, но у меня возникают проблемы с выяснением, как это сделать в awk.

1 Ответ

0 голосов
/ 15 марта 2019

Закончился без необходимости awk и сделал это с помощью perl. Регулярное выражение в значительной степени идентично. У меня есть переменная с именем $ tmp_field, в которой есть текущая строка, которую я хочу отредактировать:

($tmp_field) =~ s/(.)\1{5,}/\1/g

Вот и все, спасибо всем

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...