У меня есть две версии SPSS на работе. SPSS 11 работает на Windows XP и SPSS 20 работает на Linux. Обе копии SPSS работают нормально. Файлы, созданные в любой версии SPSS, открываются без происшествий в другой версии SPSS. И.Е. - Я могу создать файл .sav с SPSS 20 в Linux и открыть его на SPSS 11 в Windows без происшествий.
Но если я создаю файл .sav с помощью SPSS 20 и импортирую данные в R или PSPP (в Linux), я получаю кучу предупреждений. Похоже, что данные импортируются правильно, но меня беспокоят предупреждения. Я не вижу никаких предупреждений при импорте файла .sav из SPSS 11 или других файлов .sav, которые мне отправили. Многие аналитики в моей компании используют SPSS, поэтому я получил файлы SPSS из разных версий SPSS и никогда раньше не видел этого предупреждения. Предупреждающие сообщения почти идентичны между PSPP и R, что имеет смысл. AFAIK, они используют одни и те же базовые библиотеки для импорта данных. Это ошибка R:
Warning messages:
1: In read.spss("test.sav") :
test.sav: File-indicated value is different from internal value for at least one of the three system values. SYSMIS: indicated -1.79769e+308, expected -1.79769e+308; HIGHEST: 1.79769e+308, 1.79769e+308; LOWEST: -1.79769e+308, -1.79769e+308
2: In read.spss("test.sav") :
test.sav: Unrecognized record type 7, subtype 18 encountered in system file
Файл .sav действительно прост. Он имеет две колонки, тупой и тупой. Оба являются целыми числами. Первые два содержат два значения 1,0. Второй ряд содержит два значения 2,0. Я могу предоставить файл по запросу (я не вижу способа загрузить его в SO). Если кто-то захочет увидеть фактический файл, напишите мне в личку, и я отправлю его вам.
dumb dumber
1.0 1.0
2.0 2.0
Мысли? Кто-нибудь знает лучший способ сообщить об ошибке в R, не заживо зажив в списке рассылки? : -)
РЕДАКТИРОВАТЬ: я использовал термин «Ошибка» в строке заголовка. Я оставлю это, но я не должен был использовать это слово. Комментарии ниже верны, указывая на то, что сообщения, которые я вижу, являются предупреждениями, а не ошибками. Однако я чувствую, что это ясно изложено в основной части вопроса выше. Очевидно, что формат данных SPSS со временем изменился, и SPSS / IBM не удалось документировать эти изменения, что является причиной проблемы.