Сначала создайте библиотеку, чтобы указать местоположение в файловой системе, где находится набор данных. Это указатель (в терминах C) на каталог.
libname myData "<path to folder>";
Оттуда вы можете использовать случайное число и шаг данных, чтобы получить N случайных значений. В качестве альтернативы можно использовать PROC SURVEYSELECT
, но у вас может не быть лицензии.
data temp;
set myData.<Data Set Name>;
__rnd = ranuni(1);
run;
proc sort data=temp ;
by __rnd;
run;
data toOutput;
set temp(obs=10000 drop=__rnd);
run;
Последний шаг данных считывает только первые 10000 записей, которые вы рандомизировали выше.
Затем вы можете использовать PROC EXPORT
для экспорта значений.
proc export data=toOutput outfile="c:\temp\output.xlsx" dbms=xlsx replace;
sheet="MyData";
run;
Самое замечательное в том, что вы можете создавать другие листы в файле с дополнительным экспортом.
proc export data=toOutput outfile="c:\temp\output.xlsx" dbms=xlsx replace;
sheet="MyData2";
run;
Это позволит вам создать несколько образцов или даже экспортировать все данные на несколько листов.