.sas - это расширение файла программы для SAS, предназначенное для использования через SAS. По сути, это командный файл, служащий в качестве файла словаря.
.sps - это расширение файла программы для SPSS, предназначенное для использования через SPSS. По сути, это командный файл, служащий файлом словаря. Я бы также дал здесь удобную ссылку, но SPSS - это продукт IBM, а их документация - адский пейзаж, который никто не должен наступать.
Несмотря на это, то, что вы пытаетесь сделать, должно быть возможным. Панд сам по себе недостаточно, поскольку в нем нет встроенных функций для решения этих ситуаций. Поддержка Pandas для SAS распространяется только на файлы данных .sas7bdat, а для SPSS распространяется только на файлы данных .sav.
Python (и Pandas) могут читать расширения .sas и .sps, поскольку они представляют собой текстовые файлы, но на самом деле ничего не могу с ними сделать.
Вот два пути, чтобы получить то, что вам нужно.
1) Установите SAS или SPSS на пробную версию, используйте ее для чтения данных и затем экспортируйтев альтернативном формате.
2) Установите и попытайтесь использовать расширение pyreadstat для Pandas.
Звучит так, как будто вы предпочитаете фреймворк pandas, и для того, чтобы это работало, вам нужно расширить возможности. В этом случае с расширением pyreadstat . Он предназначен для работы с файлами данных SAS и SPSS и обрабатывает их гораздо эффективнее, чем панды. Это решение поставляется с оговоркой.
Pyreadstat сам по себе является преобразованием ReadStat. Цитирование файла readme pyreadstat:
This module is a wrapper around the excellent Readstat C library by Evan Miller.
Readstat is the library used in the back of the R library Haven,
meaning pyreadstat is a python equivalent to R Haven.
Если вы посмотрите только на файлы pyreadstat, вы не найдете ничего касающегося файлов .sas или .sps или словаря в целом. Вместо этого вам нужно посмотреть readme для ReadStat, найденного здесь . В нем есть раздел, специально посвященный таким обстоятельствам.
На данный момент я не тестировал команды и функции ReadStat, которые существуют для файлов словарей в pyreadstat, поэтому есть вероятность, что это не будет работать.
Если вы попробуете это решение, и оно вам не поможет, проследите за обсуждением, и я помогу вам устранить неполадки.