Question

Ну, у меня есть следующий файл:

Progeny Sire    Dam    Sex  PENAS       P35         P41
13254   11908   11421   M   47.275811   1322.828674 1719.183748
13323   11335   11386   M   43.29896    1225.57111  1634.436447
13562   11864   11895   M   47.884191   1228.568357 1615.427502
13338   11335   11970   M   45.780973   1196.32757  1561.900145

Мне нужно транспонировать PENAS, P35 и P41 столбцы.Эти столбцы будут новым столбцом: возраст.Визуально мне нужно, чтобы этот файл был таким:

Progeny Sire    Dam     Sex AGE     Peso
13254   11908   11421   M   PENAS   47.275811
13254   11908   11421   M   P35     1322.828674
13254   11908   11421   M   P41     1719.183748
13323   11335   11386   M   PENAS   43.29896
13323   11335   11386   M   P35     1225.57111
13323   11335   11386   M   P41     1634.436447
13562   11864   11895   M   PENAS   47.884191
13562   11864   11895   M   P35     1228.568357
13562   11864   11895   M   P41     1615.427502
13338   11335   11970   M   PENAS   45.780973
13338   11335   11970   M   P35     1196.32757
13338   11335   11970   M   P41     1561.900145

Я пробовал эту команду, но она не работала:

awk 'NR==1{h=$1 OFS $2 OFS $3 OFS $4 OFS $5 OFS $6 OFS $7; next}
            {a[$2]=(($1 in a)?(a[$1] OFS $NF):(OFS $5 OFS $6 OFS $7 OFS "AGE"));
             if(!($7 in b)) {h=h OFS $7; b[$7]}}
        END{print h; for(k in a) print k,a[k]}' a.txt | column -t > b

И я застрял на этом этапе, любые предложения, пожалуйста?Благодарю.Обратите внимание, что мой оригинальный набор состоит из 1400 строк.

Ed Morton · Answer 1 · 05 июня 2018

При использовании GNU awk для gensub ():

$ cat tst.awk
BEGIN { numPfx=4 }
{ pfx = gensub("((\\S+\\s+){"numPfx"}).*","\\1",1) }
NR==1 {
    split($0,ages)
    print pfx, "AGE", "Peso"
    next
}
{
    for (i=numPfx+1; i<=NF; i++) {
        print pfx, ages[i], $i
    }
}

$ awk -f tst.awk file | column -t
Progeny  Sire   Dam    Sex  AGE    Peso
13254    11908  11421  M    PENAS  47.275811
13254    11908  11421  M    P35    1322.828674
13254    11908  11421  M    P41    1719.183748
13323    11335  11386  M    PENAS  43.29896
13323    11335  11386  M    P35    1225.57111
13323    11335  11386  M    P41    1634.436447
13562    11864  11895  M    PENAS  47.884191
13562    11864  11895  M    P35    1228.568357
13562    11864  11895  M    P41    1615.427502
13338    11335  11970  M    PENAS  45.780973
13338    11335  11970  M    P35    1196.32757
13338    11335  11970  M    P41    1561.900145

При использовании других awk вы просто замените gensub () на переменную plus sub () и замените \\S на [^[:space:]] и * 1006.* с [[:space:]].

karakfa · Answer 2 · 05 июня 2018

вот еще один awk, не зависящий от количества столбцов ...

$ awk 'NR==1{n=split($0,h); 
             for(i=1;i<=NF-3;i++) printf "%s", $i OFS; 
             printf "%s\n", "AGE" OFS "Peso"; next} 
            {split($0,p); 
             NF--; 
             for(i=1;i<=3;i++) 
               {$(NF-1)=h[NF-2+i]; 
                $NF=p[NF-2+i]; 
                print}}' file | column -t


Progeny  Sire   Dam    Sex  AGE    Peso
13254    11908  11421  M    PENAS  47.275811
13254    11908  11421  M    P35    1322.828674
13254    11908  11421  M    P41    1719.183748
13323    11335  11386  M    PENAS  43.29896
13323    11335  11386  M    P35    1225.57111
13323    11335  11386  M    P41    1634.436447
13562    11864  11895  M    PENAS  47.884191
13562    11864  11895  M    P35    1228.568357
13562    11864  11895  M    P41    1615.427502
13338    11335  11970  M    PENAS  45.780973
13338    11335  11970  M    P35    1196.32757
13338    11335  11970  M    P41    1561.900145

RavinderSingh13 · Answer 3 · 05 июня 2018

После awk может также помочь здесь.

awk '
FNR==1{
  for(i=5;i<=NF;i++){
    a[++h]=$i};
  NF-=2;
  $NF="AGE Peso";
  print;
  next}
{
  for(j=5;j<=NF;j++){
    printf("%s %s %s %s %s %s\n",$1,$2,$3,$4,a[++k],$j);
    k=j==NF?k="":k}
}' Input_file | column -t

Thor · Answer 4 · 05 июня 2018

Я бы сделал это так:

transpose.awk

NR == 1 { 
  NF     -= 2         # Remove last two header columns
  $NF     = "AGE"     # Add AGE column header
  $(NF+1) = "Peso"    # Add Peso column header
  print               # Print header
  next                # Skip to next line
}

{
  for (i=5; i<=7; i++) {
    if(i==5) s = "PENAS"
    if(i==6) s = "P35"
    if(i==7) s = "P41"

    print $1, $2, $3, $4, s, $i
  }
}

Запустите его, например, так:

awk -v OFS='\t' -f transpose.awk infile

Вывод:

Progeny Sire    Dam     Sex AGE     Peso
13254   11908   11421   M   PENAS   47.275811
13254   11908   11421   M   P35     1322.828674
13254   11908   11421   M   P41     1719.183748
13323   11335   11386   M   PENAS   43.29896
13323   11335   11386   M   P35     1225.57111
13323   11335   11386   M   P41     1634.436447
13562   11864   11895   M   PENAS   47.884191
13562   11864   11895   M   P35     1228.568357
13562   11864   11895   M   P41     1615.427502
13338   11335   11970   M   PENAS   45.780973
13338   11335   11970   M   P35     1196.32757
13338   11335   11970   M   P41     1561.900145

Предупреждение

Обратите внимание на предупреждение в комментариях от EdMorton о связях с NF.

Организовать файл с AWK

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Предупреждение

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Организовать файл с AWK

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Предупреждение

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы