У меня есть CSV-файл, содержащий извлечение переменных для файлов в определенном каталоге.Таким образом, количество столбцов в строке может быть разным, например:
filename1,variable1,variable2,variable3,variable4
filename2,variable1,variable2,variable5
filename3,variable1,variable5,variable6,variable7,variable8
(конечные запятые удалены)
Команда:
awk -F ',' "{print NF}" < input.csv
Не делать на самом делехитрость, поскольку он просто отображает количество столбцов для «самой большой» строки в файле для всех строк.
Было бы здорово, если бы я мог получить количество переменных в каждой строке, и что еще более важно,получить количество уникальных полей во всем файле.
Идеальный результат для первого запроса будет выглядеть примерно так:
filename1 4
filename2 3
filename3 5
Идеальный результат для второго запроса (количество уникальных полей во всем файле):
8
Какие-нибудь отличные идеи о том, как подойти к этому?
Спасибо,
С наилучшими пожеланиями, Биргитте