Чтение расширения файла .pp (Post Processing Format) в Pyspark - PullRequest
0 голосов
/ 22 января 2020

Файлы, прикрепленные в формате .pp или в формате постобработки, представляют собой файлы данных, разработанные Met office, официальной национальной службой погоды Соединенного Королевства.

Я пытаюсь прочитать файл из указанного места. Я не нашел никаких библиотек pyspark, которые могли бы читать файлы в формате .pp. Кроме того, функции pandas / xlrd не работают.

dataframe = sc.textFile(file_path).collect()

Чтение файла с использованием функции textFile возвращает зашифрованный формат.

Любые входные данные для этого будут приняты с благодарностью. .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...