Мне нужно загрузить чистый текстовый RDD в спарк.Но по некоторым причинам имя файла загружаемого файла должно называться «xxx.gz».Этот файл по умолчанию распознается как файл gz при использовании sc.textFile.Как я могу сказать спекулянту распознать файл как чистый текстовый файл?
Вы можете использовать gzip .
gzip.open(filename, mode='rb', compresslevel=9, encoding=None, errors=None, newline=None)