У меня есть фрейм данных с колонкой расстояний:
+++++++++++++++++++
| distance |
+++++++++++++++++++
| 12.25 |
| 14.2 |
| 1.22 |
| 7.158 |
++++++++++++++++++++
Я хочу разделить данные на тестовые данные и данные обучения. Я использовал этот код
val splits = df_f.cache().randomSplit(Array(0.6, 0.4), seed = 11L)
val training = splits(0)
val test = splits(1)
и рассчитал среднее и стандартное отклонение обучающих данных и преобразовал тестовые данные.
Как рассчитать среднее и стандартное отклонение обучающих данных и заполнил его данные испытаний с использованием scala