Использование SparkContext.binaryFiles()
должно помочь. Вам просто нужно создать контент, указав соответствующий кодировку.
Пример ниже для ISO_8859:
val df = spark.sparkContext.binaryFiles(filePath, 12)
.mapValues(content => new String(content.toArray(), StandardCharsets.ISO_8859_1))
.toDF
Подробнее здесь .