Я нахожу смешанные результаты поиска в Google. У меня есть необходимость проанализировать SPSS-файл .sav, чтобы найти макет данных и извлечь результаты опроса. Шаг первый - прочитать «схему» данных. Например, мне нужно знать вопрос и тип разрешенных ответов. Я планирую смоделировать эти данные в своей собственной таблице SQL, чтобы можно было нарезать их на части в соответствии с требованиями моих приложений. Шаг второй - заполнить мою модель данных ответами респондентов. Глядя на сохраненный файл SPSS, я считаю, что в нем содержатся оба типа данных, которые я ищу.
Мне не нужно или не нужно дорогостоящее программное обеспечение SPSS, если оно мне строго не нужно. Мы не будем делать статистику по этим данным, просто выбрав подмножества респондентов на основе фильтров ответов. Файл SPSS будет предоставлен компанией-партнером, которая лицензирует SPSS. Мне не нужно выводить какие-либо данные обратно в SPSS; Мой вариант использования только для чтения.
Я могу использовать Python, Java с или без Groovy, C / C ++ для моей программы парсера. Эта программа будет запущена один раз в конце сбора данных, поэтому производительность не особенно важна. В идеале я хотел бы, чтобы мой код был кроссплатформенным, чтобы я мог разрабатывать на своем Mac и развертывать на Linux, но я могу использовать Windows, если нужно,
Многое из того, что я нахожу, это либо классы java 2004 года, либо современный код Python, который требует DLL от IBM и специфичен для Windows. Основываясь на моем быстром объяснении требований, я был бы признателен за рекомендации сообщества SO. Я думаю, что мои потребности просты, но не нашли именно то, на что я надеялся. Библиотека с открытым исходным кодом была бы идеальной, но я бы даже заплатил за простое коммерческое решение по разумной цене.