количество (непустых) строк кода в bash - PullRequest
134 голосов
/ 22 сентября 2008

Как в Bash подсчитать количество непустых строк кода в проекте?

Ответы [ 17 ]

174 голосов
/ 22 сентября 2008
cat foo.c | sed '/^\s*$/d' | wc -l

А если вы считаете комментарии пустыми строками:

cat foo.pl | sed '/^\s*#/d;/^\s*$/d' | wc -l

Хотя это зависит от языка.

50 голосов
/ 22 сентября 2008
#!/bin/bash
find . -path './pma' -prune -o -path './blog' -prune -o -path './punbb' -prune -o -path './js/3rdparty' -prune -o -print | egrep '\.php|\.as|\.sql|\.css|\.js' | grep -v '\.svn' | xargs cat | sed '/^\s*$/d' | wc -l

Выше приведено общее количество строк кода (пустые строки удалены) для проекта (текущая папка и все подпапки рекурсивно).

В приведенных выше "./blog" "./punbb" "./js/3rdparty" и "./pma" находятся папки, которые я в черном списке, поскольку я не написал в них код. Также .php, .as, .sql, .css, .js являются расширениями просматриваемых файлов. Любые файлы с другим расширением игнорируются.

32 голосов
/ 22 сентября 2008

Если вы хотите использовать что-то кроме сценария оболочки, попробуйте CLOC :

cloc считает пустые строки, комментарий линии и физические линии источника код на многих языках программирования. Это написан полностью на Perl без зависимости вне стандарта распространение Perl v5.6 и выше (код из некоторых внешних модулей встроен в часы) и так вполне портативный.

26 голосов
/ 22 сентября 2008

Есть много способов сделать это, используя обычные утилиты оболочки.

Мое решение:

grep -cve '^\s*$' <file>

Поиск строк в строках, которые не соответствуют (-v), которые соответствуют шаблону (-e) '^ \ s * $', который является началом строки, за которой следует 0 или более пробелов символы, за которыми следует конец строки (т. е. нет содержимого, отличного от пробела), и отображается количество совпадающих строк (-c) вместо самих совпадающих строк.

Преимущество этого метода перед методами, включающими конвейерную обработку в wc, заключается в том, что вы можете указать несколько файлов и получить отдельный счетчик для каждого файла:

$ grep -cve '^\s*$' *.hh

config.hh:36
exceptions.hh:48
layer.hh:52
main.hh:39
13 голосов
/ 22 сентября 2008

'wc' считает строки, слова, символы, поэтому для подсчета всех строк (включая пустые) используйте:

wc *.py

Чтобы отфильтровать пустые строки, вы можете использовать grep:

grep -v '^\s*$' *.py | wc

'- v' говорит grep выводить все строки, кроме тех, которые соответствуют «^» - начало строки '\ s *' - ноль или более пробельных символов «$» - это конец строки * .py - мой пример для всех файлов, которые вы хотите считать (все файлы Python в текущем каталоге) труба выводится в туалет. Пошли.

Я отвечаю на свой (настоящий) вопрос. Не удалось найти запись переполнения стека, покрывающую это.

7 голосов
/ 04 июня 2014

Эта команда подсчитывает количество непустых строк.
cat fileName | grep -v ^$ | wc -l
grep -v ^ $ функция регулярного выражения игнорирует пустые строки.

4 голосов
/ 14 февраля 2014
grep -cvE '(^\s*[/*])|(^\s*$)' foo

-c = count
-v = exclude
-E = extended regex
'(comment lines) OR (empty lines)'
where
^    = beginning of the line
\s   = whitespace
*    = any number of previous characters or none
[/*] = either / or *
|    = OR
$    = end of the line

Я публикую это, потому что другие варианты дали неправильные ответы для меня. Это работало с моим исходным кодом Java, где строки комментариев начинаются с / или * (я использую * в каждой строке многострочного комментария).

4 голосов
/ 22 сентября 2008
cat 'filename' | grep '[^ ]' | wc -l

должен хорошо справиться с задачей

3 голосов
/ 22 сентября 2008
awk '/^[[:space:]]*$/ {++x} END {print x}' "$testfile"
2 голосов
/ 01 апреля 2014

Вот скрипт Bash, который считает строки кода в проекте. Он рекурсивно просматривает исходное дерево и исключает пустые строки и однострочные комментарии, которые используют "//".

# $excluded is a regex for paths to exclude from line counting
excluded="spec\|node_modules\|README\|lib\|docs\|csv\|XLS\|json\|png"

countLines(){
  # $total is the total lines of code counted
  total=0
  # -mindepth exclues the current directory (".")
  for file in `find . -mindepth 1 -name "*.*" |grep -v "$excluded"`; do
    # First sed: only count lines of code that are not commented with //
    # Second sed: don't count blank lines
    # $numLines is the lines of code
    numLines=`cat $file | sed '/\/\//d' | sed '/^\s*$/d' | wc -l`

    # To exclude only blank lines and count comment lines, uncomment this:
    #numLines=`cat $file | sed '/^\s*$/d' | wc -l`

    total=$(($total + $numLines))
    echo "  " $numLines $file
  done
  echo "  " $total in total
}

echo Source code files:
countLines
echo Unit tests:
cd spec
countLines

Вот как выглядит вывод моего проекта :

Source code files:
   2 ./buildDocs.sh
   24 ./countLines.sh
   15 ./css/dashboard.css
   53 ./data/un_population/provenance/preprocess.js
   19 ./index.html
   5 ./server/server.js
   2 ./server/startServer.sh
   24 ./SpecRunner.html
   34 ./src/computeLayout.js
   60 ./src/configDiff.js
   18 ./src/dashboardMirror.js
   37 ./src/dashboardScaffold.js
   14 ./src/data.js
   68 ./src/dummyVis.js
   27 ./src/layout.js
   28 ./src/links.js
   5 ./src/main.js
   52 ./src/processActions.js
   86 ./src/timeline.js
   73 ./src/udc.js
   18 ./src/wire.js
   664 in total
Unit tests:
   230 ./ComputeLayoutSpec.js
   134 ./ConfigDiffSpec.js
   134 ./ProcessActionsSpec.js
   84 ./UDCSpec.js
   149 ./WireSpec.js
   731 in total

Наслаждайтесь! - Карран

...