linux, разделенные запятыми ячейки, чтобы сохранить / объединить столбец - PullRequest
3 голосов
/ 24 мая 2011

Здесь был похожий вопрос, но для excel / vba Макрос Excel - разделенные запятыми ячейки для строк Сохранить / объединить столбец , поскольку у меня большой файл (> 300 МБ), это не вариант, поэтому яя изо всех сил, чтобы заставить его работать в Bash.

На основании этих данных

 1   Cat1                 a,b,c
 2   Cat2                 d
 3   Cat3                 e
 4   Cat4                 f,g

Я хотел бы преобразовать его в:

 1   Cat1                 a
 1   Cat1                 b
 1   Cat1                 c
 2   Cat2                 d
 3   Cat3                 e
 4   Cat4                 f
 4   Cat4                 g

Ответы [ 2 ]

3 голосов
/ 24 мая 2011
cat > data << EOF
1   Cat1                 a,b,c
2   Cat2                 d
3   Cat3                 e
4   Cat4                 f,g
EOF

set -f                               # turn off globbing
IFS=,                                # prepare for comma-separated data
while IFS=$'\t' read C1 C2 C3; do    # split columns at tabs
    for X in $C3; do                 # split C3 at commas (due to IFS)
        printf '%s\t%s\t%s\n' "$C1" "$C2" "$X"
    done
done < data
2 голосов
/ 24 мая 2011

Это похоже на задание для awk или perl.

awk 'BEGIN { FS = OFS = "\t" }
     { split($3, a, ",");
       for (i in a) {$3 = a[i]; print} }'
perl -F'\t' -alne 'foreach (split ",", $F[2]) {
                       $F[2] = $_; print join("\t", @F)
                   }'

Обе программы основаны на одном и том же алгоритме: разбейте третий столбец на запятые, и итерируйте по компонентам, печатая исходную строку с каждымкомпонент в третьем столбце по очереди.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...