Я пытаюсь преобразовать логические, квадратные, кубические и лог-коэффициенты моих входных данных, чтобы получить исчерпывающий обзор наиболее эффективных преобразований в одномерной регрессии
Я попробовал следующий код в наборе данных с 1000переменные - возвращает ошибку / не хватает памяти или просто не может быть выполнен.Существуют ли какие-либо ограничения для массового преобразования переменных таким образом с использованием массивов?
/*Create a table for reference*/
DATA input_data;
ARRAY var_[*] var_1-var_1000;
DO i = 1 to 1000;
DO i = 1 to 1000;
var_(i)= i*j;
output;
END;
END;
RUN;
/*Log, square, cubic, logit transform all variables*/
DATA input_transform;
SET input_data;
ARRAY var[*] var_1-var_1000;
ARRAY log[*] log_1-log_1000;
ARRAY logit[*] logit_1-logit_1000;
ARRAY sq[*] sq_1-sq_1000;
ARRAY cubic[*] cubic_1-cubic_1000;
DO i = 1 to 1000;
log(i) = log(var(i));
logit(i) = log((var(i))/(1-var(i)));
sq(i) = var(i)**2;
cubic(i) = var(i)**3;
END;
RUN;
Новый набор данных с 5000 переменными каждая с соответствующим преобразованием