Нахождение суммы всех столбцов в ошибке блоков данных - PullRequest
1 голос
/ 21 мая 2019

Я новичок в Scala, и я в основном хочу выполнить несколько агрегаций для набора данных. Можно ли сгруппировать их все вместе или я должен сделать каждый отдельный (сумма, мин, макс)?

Это то, что я пробовал до сих пор:

display(
  myDF
    .groupBy($"age","sex","cp","trestbps","chol")
    .sum()
)

И мне выдается следующее сообщение об ошибке:

ошибка: перегружено значение метода groupBy с альтернативами:

(столбец 1: строка, столбцы: Строка *) org.apache.spark.sql.RelationalGroupedDataset

(перевалы: org.apache.spark.sql.Column *) org.apache.spark.sql.RelationalGroupedDataset

нельзя применять к (org.apache.spark.sql.ColumnName, String, String, Строка, Строка)

1 Ответ

0 голосов
/ 22 мая 2019

Хотите сумму всего столбца? Если так, то

myDF.agg (sum ("имя столбца")). Show ()

Ваш вопрос немного неясен. Вы можете выполнить агрегацию, используя .agg (сумма («имя столбца»), max («имя столбца»))

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...