Как читать и писать сжатые SequenceFile
в Spark с использованием Python.
Я использую Spark 1.6 на CDH 5.12 Quickstart VM с Python 2.7
Найден пример, как показано ниже, но не работает.
rdd.saveAsSequenceFile(<path location>, Some(classOf[compressionCodecClass]))
sparkContext.sequenceFile(<path location>,
classOf[<class name>],
classOf[<compressionCodecClass >]);
Нужен рабочий код для проверки.