Я анализирую набор данных медицинской карты, где пациенты обследовались на ИППП в 4 разных временных точках. Диспетчер данных создал линию для каждого пациента на ИППП для каждого периода времени. Я хочу объединить набор данных, чтобы в каждой временной точке была указана одна строка для каждого диагностированного ИППП.
Я создал новые переменные для захвата каждой ИППП, которая будет указана в переменной Dx, но я не могу понять, как объединить данные в одном и том же наборе данных, чтобы в каждый момент времени была только одна на пациента.
data dx;
set dx;
if dx='ANOGENITAL WARTS (CONDYLOMATA ACUMINATA)' then MRWarts=1;
if dx='CHLAMYDIA' then MRCHLAMYDIA=1;
if dx='DYSPLASIA (ANAL, CERVICAL, OR VAGINAL)' then MRDYSPLASIA=1;
if dx='GONORRHEA' then MRGONORRHEA=1;
if dx='HEPATITIS B (HBV)' then MRHEPB=1;
if dx='HUMAN PAPILLOMAVIRUSES (HPV)-ANY MANIFESTATION' then MRHPV=1;
if dx='PEDICULOSIS PUBIS' then MRPUBIS=1;
if dx='SYPHILIS' then MRSYPHILIS=1;
if dx='TRICHOMONAS VAGINALIS' then MRTRICHOMONAS=1;
run;
Изображение структуры данных, которую я ищу