Как в SAS создать идентификатор для каждой уникальной комбинации набора переменных?
У меня есть, например, несколько тысяч наблюдений с дихотомическим значением для шести переменных.Есть 2 ^ 6 уникальных комбинаций для значений этих переменных для каждого наблюдения.Я хотел бы создать идентификатор для каждой уникальной комбинации и в конечном итоге сгруппировать свои наблюдения в соответствии с этим значением.
Имею:
SubjectID Var1 Var2 Var3 Var4 Var5 Var6
---------------------------------------------------------------
ID1 1 1 1 1 1 1
ID2 1 0 1 1 1 1
ID3 0 1 1 1 1 1
ID4 0 0 1 1 1 0
... ... ... ... ... ... ...
ID3000 1 1 0 1 0 0
Хочу:
SubjectID Var1 Var2 Var3 Var4 Var5 Var6 Identifier
------------------------------------------------------------------------------
ID1 1 1 1 1 1 1 A
ID2 1 1 1 1 1 1 A
ID3 0 1 1 1 1 1 B
ID4 0 0 1 1 1 0 C
... ... ... ... ... ... ...
ID3000 1 1 0 1 0 0 Z
A
будет представлять 1, 1, 1, 1, 1, 1 как уникальную комбинацию, а B
будет представлять 0, 1, 1, 1, 1, 1 и т. Д.
Я думал о созданиификтивная переменная, основанная на 64 условных выражениях Var1-Var6.Я также подумал о объединении значений из Var1-Var6 в новую строку для создания уникального идентификатора.
Есть ли более простой способ сделать это?
Я предпочитаю подход, который присваивает определенный идентификатор конкретной комбинации значений, а не тот, который просто генерирует некоторую произвольную уникальную строку всякий раз, когда появляется новая комбинация.