У меня большой разделенный пробелами файл с тысячами строк и столбцов.Я хотел бы удалить все строки, которые имеют одинаковые значения во всех столбцах, кроме первого.
Ввод:
CHROM 108 139 159 265 350 351
SNP1 -1 -1 -1 -1 -1 -1
SNP2 2 2 2 2 2 2
SNP3 0 0 0 -1 -1 -1
SNP4 1 1 1 1 1 1
SNP5 0 0 0 0 0 0
Желаемый
CHROM 108 139 159 265 350 351
SNP3 0 0 0 -1 -1 -1
Существует аналогичныйзаданный вопрос для Panda Framework ( Удалите повторяющиеся строки с одинаковыми значениями во всех столбцах панд ), и я нашел несколько частичное решение, которое удаляет строки, содержащие только ноль
awk 'NR > 1{s=0; for (i=3;i<=NF;i++) s+=$i; if (s!=0)print}' input > outfile
, но яхочу сделать это для чисел -1, 0, 1 и 2 за один раз с заголовком и 1-м столбцом в качестве идентификатора.
Любая помощь будет высоко оценена.