Я заметил, что вы указали метку apache-spark, если вы имели в виду что-то для vanilla scala, этот ответ не будет применим.Используя этот код, вы можете получить RDD[String]
, который является наиболее текстовым типом структуры распределенных данных.
// Where sc is your spark context
> val textFile = sc.textFile("myFile.json")
textFile: org.apache.spark.rdd.RDD[String]