У меня есть два набора данных с одинаковым содержимым, но один в формате с разделителями табуляции, а другой в формате с разделителями пробелами.
С пробелами
Tab_Delimited
У меня есть три вопроса, которые я не смог понять, и хотел бы попросить о помощи. Любые предложения будут высоко оценены.
Во-первых, я использовал TextWrangler, чтобы открыть эти два набора данных, и я чувствую, что набор данных, разделенный пробелами, означает, что наборы данных разделены пробелами, и наблюдения каждой строки находятся в одной и той же позиции.
С другой стороны, мое понимание набора данных с разделителями табуляцией заключалось в том, что наборы данных, разделенные пробелами и пробелами, могут не требовать одинаковой ширины для каждой строки переменных. Было ли мое понимание правильным? У меня проблемы с распознаванием.
Во-вторых, я печатал набор данных о снегопаде, как упомянуто выше, от строки № 5 до строки № 122, и значения "T" в наборе данных должны
быть преобразовано в 0.
Мой код для файла данных о снегопаде, разделенного пробелами, был таким, как показано ниже,
и мой вопрос был о его LOG. Было много предупреждений о «Т», но я не получил никаких ошибок.
LOG
Должен ли я беспокоиться о предупреждениях, упомянутых здесь
"неверные данные за месяц (i) в строке ..."
* Trying Space-Delimited data set;
OPTIONS Errors=200;
DATA SASWEEK.SnowSpace;
DROP i MyTot diff;
INFILE "&dirLSB.RochesterSnowfallSpace.txt" FIRSTOBS= 2 OBS= 122;
INPUT Season $ Sep Oct Nov Dec Jan Feb Mar Apr May Total ;
ARRAY Month(10) Sep -- Total;
DO i = 1 TO 10 ;
IF Month(i) = . THEN Month(i) = 0 ;
MyTot = sum (of Sep -- May);
diff = round (MyTot-Total, 3);
IF diff ne 0 THEN PUT "**ERROR" MyTot= Total= diff= ;
END;
PROC PRINT DATA=sasweek.snowspace;
TITLE "Rochester Snowfall in Space-Delimited format";
RUN;
Один из моих профессоров предположил, что я должен был сделать ежемесячный снегопад "характером". Таким образом, буквы «Т» не будут предупреждены в журнале. Я не уверен, должен ли я попробовать это так.
Наконец, я попытался использовать «Proc Import» для того же набора данных, но в файле xls.
Набор данных представляет собой ссылку
И мой код выглядит следующим образом:
* Trying Excel file ;
OPTIONS ERRORS=200;
OPTIONS MSGLEVEL=i;
PROC IMPORT OUT=SASWEEK.SNOWxls
DATAFILE= "&dirLSB.RochesterSnowfall.xls" DBMS=xls;
GETNAMES= no;
RANGE= "Sheet1$a5:k122" ;
PROC PRINT DATA= SASWEEK.SNOWxls;
TITLE "Rochester Snowfall in xls format";
RUN;
Я получил ошибку в журнале, сохраненном как HTML
Я все еще распечатал часть набора данных, но имена переменных были перепутаны, и вывод не был завершен.
Есть идеи?
Спасибо всем за чтение и спасибо за любую помощь:)