рассчитать среднее и среднее значение точки данных, используя искру / scala - PullRequest
0 голосов
/ 17 марта 2020

У меня есть фрейм данных с колонкой расстояний:

+++++++++++++++++++
|     distance     |
+++++++++++++++++++
|     12.25        |
|     14.2         |
|     1.22         |
|     7.158        |
++++++++++++++++++++

Я хочу разделить данные на тестовые данные и данные обучения. Я использовал этот код

val splits = df_f.cache().randomSplit(Array(0.6, 0.4), seed = 11L)
val training = splits(0)
val test = splits(1)

и рассчитал среднее и стандартное отклонение обучающих данных и преобразовал тестовые данные.

Как рассчитать среднее и стандартное отклонение обучающих данных и заполнил его данные испытаний с использованием scala

...