Я получил файл SPSS из опроса, проведенного другой компанией, который, как утверждается, содержит только ~ 1500 респондентов, но размер файла как-то увеличился до 4,2 ГБ.Я догадываюсь, что причина этого в том, что файл был из глобального опроса, и 1500 записей, которые были выбраны, только из США, так что есть ряд пустых переменных, метаданные для этих переменных, которые включены в этот файл, итакже может быть на нескольких языках / алфавитах.
Мне нужна только подмножество этих данных, и я могу работать с ними, если я удалю метаданные, но моя проблема заключалась в том, что я не могу открыть эту чертову вещьсократить количество переменных.Я использовал имеющиеся в моем распоряжении инструменты, чтобы попробовать следующие обходные пути, хотя я уверен, что есть лучшие варианты:
Открытие файла с помощью PSPP (бесплатная SPSS) - это вызываетPSPP перестает отвечать
Использование команды R read.spss (из стороннего пакета) для записи .csv - это утверждает, что файл имеет повторяющееся имя переменной и не будет продолжатьдалее
- Использование команды R spss.system.file для записи .csv - когда я попробовал это, R потратил много времени на размышления, пытаясь запустить это и выполнялв течение пары часов без видимого успеха.
- Использование инструмента преобразования текста PSPP (https://pspp.benpfaff.org/) для создания словаря или файла .csv - оба эти параметра аварийно завершают работу после завершения загрузки файла.
Я вернулся в другую компанию, чтобы попытаться заставить их работать над уменьшением размера файла, однако я не был уверен, есть ли у кого-нибудь еще какие-либо идеи сделать одно из следующих действий:
- Откройте файл с помощью другой программы / конвертера, который может превратить его в .csv или другой аналогичный формат файла с тонкими файлами
- Используйте другую программу, чтобы хотя бы прочитать только имена переменных, включенных вфайл, чтобы я мог предоставить другой компании необходимые переменные