Я хочу сохранить все дубликаты идентификаторов, кроме случаев, когда нет новой информации из-за пропущенных значений.Например,
data test;
input id var1 var2 var3
datalines;
1 2 3 4
1 4 . 4
1 6 5 4
1 . 3 .
1 2 4 4
1 6 . 4
1 . 8 4
;
run;
Я хочу, чтобы результат был
1 2 3 4
1 4 . 4
1 6 5 4
1 2 4 4
1 . 8 4
Строка 4 удалена, поскольку строка 1 имеет одинаковые id, var2 и var3.Строка 6 удалена, потому что строка 3 имеет тот же идентификатор, var1, var3.Я также хочу надежное решение, так как я хочу, чтобы решение работало для любого числа переменных в наборе данных (id всегда будет уникальным ключом).
Есть мысли?Я думал сортировать nodupkey, но он не работает, если в строке более одного пропущенного значения.