Сравнение наборов данных - PullRequest
0 голосов
/ 22 марта 2012

У меня есть 2 набора данных.1, содержащий столбцы origin_zip (число) и destination_zip (char) и tracking_number (char), а другой содержит zip.

Я хотел бы сравнить эти 2 набора данных, чтобы я мог видеть все номера отслеживания и destination_zips, которыеотсутствует в столбце zip второго набора данных.

Кроме того, я хотел бы увидеть все номера отслеживания и origin_zips, где origin_zips = destination_zips.

Как бы мне этого добиться?

origin_zip    destination_zip    tracking_number
12345         23456              11111
34567         45678              22222
12345         12345              33333

zip
12345
34567
23456

results_tracking_number
22222
33333

1 Ответ

0 голосов
/ 22 марта 2012

Давайте начнем с этого ... Я не думаю, что это полностью отвечает на ваш вопрос, но дополните его комментариями, и я помогу, если смогу ...

data zips;
input origin_zip $ destination_zip $ tracking_number $;
datalines;
12345         23456              11111
34567         45678              22222
56789         12345              33333
;

data zip;
input zip $;
datalines;
12345
54321
34567
76543
56789
;

Proc sort data=zips;
by origin_zip;
run;

Proc sort data=zip;
by zip;
run;

Data contained not_contained;
merge zip(in=a) zips(in=b rename=(origin_zip=zip));
by zip;
if a and b then output contained;
if a and not b then output not_contained;
run;
...