У меня есть данные с 40M строк.Есть 50 столбцов, которые я хотел бы извлечь из них строки.Я использовал обычный шаг данных с массивом для выполнения задачи, но для извлечения потребовалось более 2 часов.
Я знаю, как использовать хэш-таблицу в SAS для простого соединения или поднабора, указав сначала таблицу поиска.Однако я предпочитаю использовать регулярное выражение для извлечения здесь.Текущее извлечение использует коды что-то вроде ниже.
Как мне выполнить поиск по хеш-таблице в этих 50 столбцах в SAS без справочной таблицы?
data want;
set have;
array cols {*} $ col1 - col50;
do i = 1 to dim(cols)
if prxmatch('/F[0-9].*[123]/', cols[i])
then output;
end;
run;