Отфильтруйте и посчитайте результаты одновременно с помощью grep и wc - PullRequest
0 голосов
/ 01 октября 2018

Мой проект Фильтрация телефонных номеров в списке, в котором так много всего.Поэтому я хочу отобразить уже отфильтрованный номер телефона с номером строки, соответствующей номеру телефона.Я фильтрую американские телефонные номера только американские телефонные номера.И правило это использовать трубу |

   grep  "^([0-9][0-9][0-9]) [0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]$" $1 | wc -l  > result-phonenumber-filter.txt 

Файл data.txt, содержащий числа, которые нам нужно отфильтровать:

      (512) 258-6589

    (205) 251-6584

    (480) 589-9856

    (303) 548-9874

    (808) 547-3215

    (270) 987-6547

    (225) 258-9887

    (314) 225-2543

    (979) 547-6854

    (276) 225-6985

    les numeros suivants ne sont pas valables pour ce programme :

    +512 325

+512 251 2545654654

+512 6546 6464646

+512546546646564646463313

(314) sgf225-2543

(314) 225-2543fsgaf

(314afd) 225-2543

FSd(314) 225-2543

Результат, который я хочу получить:

(512) 258-6589
(205) 251-6584
(480) 589-9856
(303) 548-9874
(808) 547-3215
(270) 987-6547
(225) 258-9887
(314) 225-2543
(979) 547-6854
(276) 225-6985

The number of line is :10

Ответы [ 2 ]

0 голосов
/ 01 октября 2018

Это излишне сложно, но работает без создания временных файлов.Требуется bash для замены процесса

grep -oP '^\s*\(\d{3}\) \d{3}-\d{4}\s*$' file | tee >(echo "there are $(wc -l) matches")

Я бы пошел с awk или perl

perl -ne '
    if (/^\s*\(\d{3}\) \d{3}-\d{4}\s*$/) {print; $count++} 
    END {print "there are $count matches\n"}
' file
awk '
    /^[[:blank:]]*\([[:digit:]]{3}\) [[:digit:]]{3}-[[:digit:]]{4}[[:blank:]]*$/ {print; count++} 
    END {print "there are", count, "matches"}
' file
0 голосов
/ 01 октября 2018
grep -E '^[ ]{0,9}\([0-9]{3}\) [0-9]{3}-[0-9]{4}[ ]{0,9}$' data.txt | sed 's/^[ \t]*//' > result-phonenumber-filter.txt
count=$(wc -l result-phonenumber-filter.txt)
echo "The number of line is :$count" >> result-phonenumber-filter.txt
$ cat result-phonenumber-filter.txt
(512) 258-6589
(205) 251-6584
(480) 589-9856
(303) 548-9874
(808) 547-3215
(270) 987-6547
(225) 258-9887
(314) 225-2543
(979) 547-6854
(276) 225-6985
The number of line is :10
...