Мне нужно удалить все строки в файле, которые содержат менее 4 уникальных символов
Ввод:
hello
cabby
pabba
lokka
lappa
coool
apple
Ожидаемый вывод:
hello
cabby
lokka
apple
Я пытался придумать регулярное выражение, чтобы сделать это, но я не могу думать, как это вообще возможно. Я нашел команду sed
, которая выглядит многообещающей, она удаляет все повторяющиеся символы. Однако я не уверен, как запрограммировать sed
, чтобы проверить, возвращает ли программа 4 символа, а затем, если это так, совпадает с исходной строкой. sed ':1;s/\(\(.\).*\)\2/\1/g;t'