Grep Рекурсивный и Граф - PullRequest
11 голосов
/ 19 мая 2009

Нужно искать в каталогах с большим количеством подкаталогов строку внутри файлов:

Я использую:

grep -c -r "string here" *

Как я могу подсчитать количество находок?

Как я могу вывести в файл только те файлы, по крайней мере, с одним экземпляром?

Ответы [ 6 ]

10 голосов
/ 19 мая 2009

Используя подстановку процессов в Bash, это дает то, что я считаю желаемым результатом? (Пожалуйста, уточните вопрос, если это не так.)

grep -r "string here" * | tee >(wc -l)

Это работает grep -r нормально, с выходом, идущим как на стандартный вывод, так и на wc -l процесс.

9 голосов
/ 19 мая 2009

Это работает для меня (он получает общее количество «строк здесь», найденных в каждом файле). Тем не менее, он не отображает общее количество всех найденных файлов. Вот как это можно получить:

grep -c -r 'string' file > out && \
    awk -F : '{total += $2} END { print "Total:", total }' out

Список будет удален, а общее количество будет отправлено на STDOUT.

Вот вывод в дереве каталогов Python2.5.4:

grep -c -r 'import' Python-2.5.4/ > out && \
    awk -F : '{total += $2} END { print "Total:", total }' out
Total: 11500

$ head out
Python-2.5.4/Python/import.c:155
Python-2.5.4/Python/thread.o:0
Python-2.5.4/Python/pyarena.c:0
Python-2.5.4/Python/getargs.c:0
Python-2.5.4/Python/thread_solaris.h:0
Python-2.5.4/Python/dup2.c:0
Python-2.5.4/Python/getplatform.c:0
Python-2.5.4/Python/frozenmain.c:0
Python-2.5.4/Python/pyfpe.c:0
Python-2.5.4/Python/getmtime.c:0

Если вы просто хотите получить строки с вхождениями 'string', измените на это:

grep -c -r 'import' Python-2.5.4/ | \
    awk -F : '{total += $2; print $1, $2} END { print "Total:", total }'

Будет выведено:

[... snipped]
Python-2.5.4/Lib/dis.py 4
Python-2.5.4/Lib/mhlib.py 10
Python-2.5.4/Lib/decimal.py 8
Python-2.5.4/Lib/new.py 6
Python-2.5.4/Lib/stringold.py 3
Total: 11500

Вы можете изменить способ печати файлов (1 доллар) и количество файлов (2 доллара).

2 голосов
/ 19 мая 2009

Некоторое решение с AWK:

grep -r "string here" * | awk 'END { print NR } 1'

Далее следует общее количество, количество файлов и количество совпадений для каждого, отображая первое совпадение каждого (для отображения всех совпадений измените условие на ++f[$1]):

grep -r "string here" * | 
    awk -F: 'END { print "\nmatches: ", NR, "files: ", length(f); 
                   for (i in f) print i, f[i] } !f[$1]++'

Вывод для первого решения (поиск в каталоге для «boost::». Я вручную обрезал некоторые слишком длинные строки, чтобы они совпали по горизонтали):

list_inserter.hpp:            return range( boost::begin(r), boost::end(r) );
list_of.hpp:            ::boost::is_array<T>,
list_of.hpp:            ::boost::decay<const T>,
list_of.hpp:            ::boost::decay<T> >::type type;
list_of.hpp:        return ::boost::iterator_range_detail::equal( l, r );
list_of.hpp:        return ::boost::iterator_range_detail::less_than( l, r );
list_of.hpp:        return ::boost::iterator_range_detail::less_than( l, r );
list_of.hpp:        return Os << ::boost::make_iterator_range( r.begin(), r.end() );
list_of.hpp:            return range( boost::begin(r), boost::end(r) );
list_of.hpp:            return range( boost::begin(r), boost::end(r) );
list_of.hpp:            return range( boost::begin(r), boost::end(r) );
ptr_list_of.hpp:                          BOOST_DEDUCED_TYPENAME boost::ptr_...
ptr_list_of.hpp:        typedef boost::ptr_vector<T>       impl_type;
13

Выход для второго

list_inserter.hpp:            return range( boost::begin(r), boost::end(r) );
list_of.hpp:            ::boost::is_array<T>,
ptr_list_of.hpp:                          BOOST_DEDUCED_TYPENAME boost::ptr_...

matches:  13 files:  3
ptr_list_of.hpp 2
list_of.hpp 10
list_inserter.hpp 1

Цвета в результате хороши (--color=always для grep), но они ломаются при прохождении через awk здесь. Так что лучше не включайте их тогда, если вы не хотите потом раскрашивать свой терминал :) Ура!

1 голос
/ 02 августа 2010
grep -rc "my string" ./ | grep :[1-9] >> file_name_by_count.txt

Работает как шарм.

1 голос
/ 19 мая 2009

Я бы попробовал комбинацию find и grep.

find . | xargs grep -c "string here"

В любом случае, grep -c -r "string here" * работает для меня (Mac OS X).

0 голосов
/ 19 мая 2009

Чтобы вывести только имена файлов с совпадениями, используйте:

grep -r -l "your string here" .

Он выведет одну строку с именем файла для каждого файла, соответствующего искомому выражению.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...