У меня есть набор из 8 файлов, и я хочу получить количество, основанное на группе по определенному столбцу, и я хочу сохранить результат каждого подсчета на основе идентификатора в отдельном кадре данных
PartitionFileList.par.foreach(fileName => {
val df: DataFrame = sqlContext.read
.format("com.databricks.spark.csv")
.option("header", true) // Use first line of all files as header
.option("delimiter", TILDE)
.option("inferSchema", "true") // Automatically infer data types
.load(fileName._2)
val aGrpCountsIds = df.groupBy("agrpid").count()
}
Каждый файл имеет столбец agrpid
, поэтому в конце этого цикла я хочу, чтобы другой фрейм данных выглядел так, как мне этого достичь
agrpid loccount propertycount det1count det2count
1 10 20 0 30
2 20 12 9 12
3 23 2 2 3
Каждый счет представляет счет из группы файлов по agrpid.Спасибо