Разбор первого столбца файла CSV в новый файл - PullRequest
27 голосов
/ 16 апреля 2010

Операционная система: OSX Метод: Из командной строки, так что с помощью sed, cut, gawk, хотя желательно без установки модулей.

По сути, я пытаюсь взять первый столбец CSV-файла и разобрать его в новый файл.

Пример входного файла

EXAMPLEfoo,60,6
EXAMPLEbar,30,6
EXAMPLE1,60,3
EXAMPLE2,120,6
EXAMPLE3,60,6
EXAMPLE4,30,6

Желаемый выход

EXAMPLEfoo 
EXAMPLEbar
EXAMPLE1
EXAMPLE2
EXAMPLE3
EXAMPLE4

Итак, я хочу первый столбец.

Вот что я пробовал до сих пор:

awk -F"," '{print $1}' in.csv > out.txt

awk -F"," '{for (i=2;i<=NF;i++)}' in.csv > out.txt

awk -F"," 'BEGIN { OFS="," }' '{print $1}' in.csv > out.txt

cat in.csv | cut -d \, -f 1 > out.txt

Кажется, что ничего не работает, либо они просто печатают первую строку, либо ничего вообще, поэтому я предполагаю, что он не может читать строку за строкой.

Ответы [ 4 ]

35 голосов
/ 16 апреля 2010

Ваш последний вариант отлично работает для меня:

$ cat > in.csv  # Then pasted the example input followed by Ctrl+D:
EXAMPLEfoo,60,6
EXAMPLEbar,30,6
EXAMPLE1,60,3
EXAMPLE2,120,6
EXAMPLE3,60,6
EXAMPLE4,30,6
[Ctrl+D]
$ cat in.csv | cut -d, -f1
EXAMPLEfoo
EXAMPLEbar
EXAMPLE1
EXAMPLE2
EXAMPLE3
EXAMPLE4

Может быть, здесь заканчиваются строки? Если файл имеет окончания строк в стиле DOS или даже в стиле старого Mac, это может вызвать странное поведение. Попробуйте запустить file in.csv и посмотрите, что получится.

$ file in.unix.csv
in.unix.csv: ASCII text
$ file in.dos.csv
in.dos.csv: ASCII text, with CRLF line terminators

Если последнее относится к вашей ситуации, используйте инструмент dos2unix для преобразования файла.

Редактировать: В OS X кажется flip - это то, что вы хотите .

11 голосов
/ 16 апреля 2010

Я скопировал ваш пример ввода, сохранил его как in.csv, а затем запустил вашу первую строку,

awk -F"," '{print $1}' in.csv > out.txt

и все заработало отлично, вот так:

$ emacs in.csv
$ cat in.csv 
EXAMPLEfoo,60,6
EXAMPLEbar,30,6
EXAMPLE1,60,3
EXAMPLE2,120,6
EXAMPLE3,60,6
EXAMPLE4,30,6
$ awk -F"," '{print $1}' in.csv > out.txt
$ cat out.txt 
EXAMPLEfoo
EXAMPLEbar
EXAMPLE1
EXAMPLE2
EXAMPLE3

Это в Terminal.app на OS X 10.5

3 голосов
/ 16 апреля 2010

Для меня сокращение дает ожидаемый результат:

cut -d, -f1 < in.csv > out.txt
0 голосов
/ 14 ноября 2015

Если Perl является опцией:

perl -F, -lane 'print $F[0]' in.csv > out.txt

Используются следующие параметры командной строки:

  • -n цикл вокруг каждой строки входного файла
  • -l удаляет символы новой строки перед обработкой и добавляет их обратно
  • -a режим автоматического разделения - разбить входные строки на массив @F. По умолчанию расщепление по пробелам.
  • -e выполнить код perl
  • -F модификатор autosplit, в этом случае разделяется на ,

@F - массив слов в каждой строке, проиндексированный, начиная с $F[0]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...