Управление большим файлом SPSS (* .sav) (4,2 ГБ) - PullRequest
0 голосов
/ 04 декабря 2018

Я получил файл SPSS из опроса, проведенного другой компанией, который, как утверждается, содержит только ~ 1500 респондентов, но размер файла как-то увеличился до 4,2 ГБ.Я догадываюсь, что причина этого в том, что файл был из глобального опроса, и 1500 записей, которые были выбраны, только из США, так что есть ряд пустых переменных, метаданные для этих переменных, которые включены в этот файл, итакже может быть на нескольких языках / алфавитах.

Мне нужна только подмножество этих данных, и я могу работать с ними, если я удалю метаданные, но моя проблема заключалась в том, что я не могу открыть эту чертову вещьсократить количество переменных.Я использовал имеющиеся в моем распоряжении инструменты, чтобы попробовать следующие обходные пути, хотя я уверен, что есть лучшие варианты:

  1. Открытие файла с помощью PSPP (бесплатная SPSS) - это вызываетPSPP перестает отвечать

  2. Использование команды R read.spss (из стороннего пакета) для записи .csv - это утверждает, что файл имеет повторяющееся имя переменной и не будет продолжатьдалее

  3. Использование команды R spss.system.file для записи .csv - когда я попробовал это, R потратил много времени на размышления, пытаясь запустить это и выполнялв течение пары часов без видимого успеха.
  4. Использование инструмента преобразования текста PSPP (https://pspp.benpfaff.org/) для создания словаря или файла .csv - оба эти параметра аварийно завершают работу после завершения загрузки файла.

Я вернулся в другую компанию, чтобы попытаться заставить их работать над уменьшением размера файла, однако я не был уверен, есть ли у кого-нибудь еще какие-либо идеи сделать одно из следующих действий:

  • Откройте файл с помощью другой программы / конвертера, который может превратить его в .csv или другой аналогичный формат файла с тонкими файлами
  • Используйте другую программу, чтобы хотя бы прочитать только имена переменных, включенных вфайл, чтобы я мог предоставить другой компании необходимые переменные

1 Ответ

0 голосов
/ 05 декабря 2018

Следующая команда из PSPP должна сделать то, что вам нужно:

$ pspp-convert originalFile.sav output.csv

В противном случае, пожалуйста, предоставьте сообщение об ошибке терминала.

...