Сохранять счетчик из группы файлов по идентификатору в отдельном кадре данных, scala - PullRequest
0 голосов
/ 12 июля 2019

У меня есть набор из 8 файлов, и я хочу получить количество, основанное на группе по определенному столбцу, и я хочу сохранить результат каждого подсчета на основе идентификатора в отдельном кадре данных

PartitionFileList.par.foreach(fileName => {

      val df: DataFrame = sqlContext.read
        .format("com.databricks.spark.csv")
        .option("header", true) // Use first line of all files as header
        .option("delimiter", TILDE)
        .option("inferSchema", "true") // Automatically infer data types
        .load(fileName._2)

      val aGrpCountsIds = df.groupBy("agrpid").count()

}

Каждый файл имеет столбец agrpid

, поэтому в конце этого цикла я хочу, чтобы другой фрейм данных выглядел так, как мне этого достичь

agrpid loccount propertycount det1count det2count
   1            10      20          0       30
   2            20      12          9       12      
   3            23      2           2       3

Каждый счет представляет счет из группы файлов по agrpid.Спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...