Получить количество подходящих шаблонов из подгруппы - PullRequest
0 голосов
/ 16 января 2019

Я пытаюсь получить количество журналов, напечатанных приложениями.Не знаю, с чего начать, я сначала сохраню все узлы:

nodes=$(awk '!a[$4]++' file)
for node in $nodes;
do
    //what logic comes here I could not manage to understand

done

Пример:

Jan  2 13:01:02 node1  app1: Some message I do not care2.
Jan  2 13:01:02 node1  app2: Some message I do not care13.
Jan  2 13:01:02 node1  app3: Some message I do not care9.
Jan  2 13:01:02 node1  app4: Some message I do not care4.
Jan  2 13:01:02 node2  app4: Some message I do not care11.
Jan  2 13:01:02 node1  app4: Some message I do not care8.
Jan  2 13:01:02 node1  app2: Some message I do not care10.
Jan  2 13:01:02 node2  app1: Some message I do not care5.
Jan  2 13:01:02 node1  app2: Some message I do not care3.

Ожидаемый результат:

node1:
app1:1
app2:3
app3:1
app4:2

node2:
app1:1
app4:1

Ответы [ 3 ]

0 голосов
/ 16 января 2019

Вот отсортированная версия вывода gawk:

awk '{a[$4][$5]++} 
     END{PROCINFO["sorted_in"] = "@ind_str_asc"
     for (e in a) {
        printf "%s:\n", e
        for (x in a[e]) 
            printf "\t%s %s\n", x, a[e][x]}}' file
node1:
    app1: 1
    app2: 3
    app3: 1
    app4: 2
node2:
    app1: 1
    app4: 1
0 голосов
/ 16 января 2019

сортировка с помощью awk

$ cat monk.txt
Jan  2 13:01:02 node1  app1: Some message I do not care2.
Jan  2 13:01:02 node1  app2: Some message I do not care13.
Jan  2 13:01:02 node1  app3: Some message I do not care9.
Jan  2 13:01:02 node1  app4: Some message I do not care4.
Jan  2 13:01:02 node2  app4: Some message I do not care11.
Jan  2 13:01:02 node1  app4: Some message I do not care8.
Jan  2 13:01:02 node1  app2: Some message I do not care10.
Jan  2 13:01:02 node2  app1: Some message I do not care5.
Jan  2 13:01:02 node1  app2: Some message I do not care3.
$ sort -k4 -k5 monk.txt | awk -F"[ :]" ' { c=$7;if(p!=c && NR>1){print p;for(i in a) print "\t" i,":",a[i];delete a }p=c;a[$9]++} END{ print p;for(i in a)print "\t" i,":",a[i]; } '
node1
        app1 : 1
        app2 : 3
        app3 : 1
        app4 : 2
node2
        app1 : 1
        app4 : 1
$

или упаковка обычного печатного кода в функцию

$ cat test.awk
function f1()
{
print p;
for(i in a) print "\t" i,":",a[i];
delete a
}
{ c=$7; if(p!=c && NR>1) { f1() } p=c;a[$9]++ }
END{ f1() }
$ sort -k4 -k5 monk.txt | gawk -F"[ :]" -f test.awk
node1
        app1 : 1
        app2 : 3
        app3 : 1
        app4 : 2
node2
        app1 : 1
        app4 : 1
$
0 голосов
/ 16 января 2019

С GNU awk для настоящих многомерных массивов (и при условии, что между именем приложения и : всегда есть пробел):

$ awk -v OFS=':' '
    { cnt[$4][$5]++ }
    END {
        for (node in cnt) {
            print node, ""
            for (app in cnt[node]) {
                print app, cnt[node][app]
            }
            print ""
        }
    }
' file
node2:
app1:1
app4:1

node1:
app1:1
app2:3
app3:1
app4:2

если порядок вывода является проблемой, уточните ваши требования в вашем вопросе, так как есть различные способы упорядочить вывод.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...