У меня есть код для анализа файла журнала, используя map transformatio
n. Затем RDD
был преобразован в DF
.
val logData = sc.textFile("hdfs://quickstart.cloudera:8020/user/cloudera/syslog.txt")
val logDataDF = logData.map(rec => (rec.split(" ")(0), rec.split(" ")(2), rec.split(" ")(5))).toDF("month", "date", "process")
Я хотел бы знать, могу ли я использовать mapPartitions
в этом случае вместо map
.