SAS: В чем разница между «файлами данных» и «файлами необработанных данных»? - PullRequest
0 голосов
/ 11 ноября 2010

Итак, согласно книгам SAS, вы делаете:

PROC IMPORT
DATAFILE="filename" | TABLE="tablename"
OUT=SAS-data-set
<DBMS=identifier><REPLACE>; 

для файлов данных, и вы используете INFILE для чтения файлов необработанных данных ...

Так что же такое "файлы необработанных данных"? Являются ли файлы данных CSV файлами или «файлами необработанных данных»? Являются ли разделенные пробелами файлы данных текстовых файлов или «файлами необработанных данных»?

1 Ответ

1 голос
/ 11 ноября 2010

Я думаю, что «файлы данных» могут относиться к файлам данных, созданным SAS, тогда как «файлы необработанных данных» относятся к любому другому источнику файлов данных (Excel, CSV, DAT и т. Д.). Как я понимаю (читая примерно из «Маленькой книги SAS» Delwiche & Slaughter), proc import будет сканировать ваш файл (по крайней мере, первые 20 строк), чтобы автоматически определить типы переменных и идеальную длину. INFILE более примитивен, но позволяет указать, какие переменные следует читать через ключевое слово input. Вы также можете выполнять манипуляции с данными непосредственно на шаге DATA, где используется ваш INFILE, что невозможно сделать с помощью proc import (по крайней мере, я так не думаю). Проверьте http://www.sfu.ca/sasdoc/sashtml/proc/z0332605.htm и http://support.sas.com/onlinedoc/913/getDoc/en/lrcon.hlp/a000998889.htm для получения дополнительной информации.

...