Как сохранить пробелы в awk с фиксированной шириной столбца - PullRequest
0 голосов
/ 08 мая 2018

У меня есть следующий файл:

Bonnr. Sessie Tijd  As okr                                        Bedrag  BTW-laag  BTW-hoog           
----------------------------------------------------------------------------------------------------- 
307717   5555 08:08 AS o                                            2,80      0,16                             
308670   5575 11:28 AS mut Supply Needs           kenmerk         -21,98                              
                           FIRM                                                                    
308671   5575 11:34 AP o                                            5,60      0,32                     

Требуемый вывод:

Bonnr.;Sessie;Tijd ;As;okr;                                       ;Bedrag ;BTW-laag;  BTW-hoog           
------;------;-----;--;---;---------------------------------------;-------;--------;----------------- 
307717;  5555;08:08;AS;o  ;                                       ;  2,80 ;    0,16;                             
308670;  5575;11:28;AS;mut;Supply Needs           kenmerk         ;-21,98 ;        ;                    
      ;      ;     ;      ;FIRM                                   ;       ;        ;                 
308671;  5575;11:34;AP;o  ;                                       ;  5,60 ;    0,32;                  

Я использую следующую команду:

awk 'BEGIN{FIELDWIDTHS="6 7 4 2 4 39 7 8 8";OFS=","}{$1=$1}1' Test.txt > Test.csv

Мой вывод:

Bonnr.,Sessie,Tijd,As,okr,Bedrag,BTW-laag,BTW-hoog
-----------------------------------------------------------------------------------------------------
307717,5555,08:08,AS,o,2,80,0,16
308670,5575,11:28,AS,mut,Supply,Needs,kenmerk,-21,98
FIRM
308671,5575,11:34,AP,o,5,60,0,32

Я не понимаю, почему awk не сохраняет пробелы в шестом столбце. Как я могу решить это?

Ответы [ 2 ]

0 голосов
/ 08 мая 2018

FIELDWIDTHS зависит от gawk и не всегда поддерживается. Вы, очевидно, не вызываете gawk или не вызываете версию gawk, которая поддерживает FIELDWIDTHS.

Это будет работать в любом awk:

$ cat tst.awk
BEGIN { split("6 7 4 2 4 39 7 8 8",poss) }
{
    for (i=1; i in poss; i++) {
        printf "%s;", substr($0,1,poss[i])
        $0 = substr($0,poss[i]+1)
    }
    print
}

$ awk -f tst.awk file
Bonnr.; Sessie; Tij;d ; As ;okr                                    ;    Bed;rag  BTW;-laag  B;TW-hoog
------;-------;----;--;----;---------------------------------------;-------;--------;--------;----------------
307717;   5555; 08:;08; AS ;o                                      ;      2;,80     ; 0,16   ;
308670;   5575; 11:;28; AS ;mut Supply Needs           kenmerk     ;    -21;,98     ;        ;
      ;       ;    ;  ;    ;    FIRM                               ;       ;        ;        ;
308671;   5575; 11:;34; AP ;o                                      ;      5;,60     ; 0,32   ;

Просто настройте свои позиции так, чтобы вы действительно хотели.

0 голосов
/ 08 мая 2018

Для этого вы можете использовать printf .

Вместо {$1=$1} вы можете иметь { printf("%6s;%7s;%4s;...", $1, $2, $3, ...) } (заменить "..." на другие поля)

Также кажется, что в вашем выводе FIELDWIDTHS не работал, потому что он выглядит так, как будто он был разделен пробелами, а не длинами столбцов. Убедитесь, что вы используете правильную версию gawk.

Также убедитесь, что ширина полей правильная. Первые 4 поля, вероятно, должны содержать «7 7 5 3 ...», а не «6 7 4 2 ...» для включения пробелов.

...