У меня есть файл паркета, который содержит идентификатор, элементы исходные данные . Я хочу вычесть элементы из повторяющегося значения 2.484 в виде вектора и поместить выходные данные в один и тот же столбец (элементы). В качестве Z-показателя для нормализации данных я хочу применить (features-2.484) /1.830.
val df = sqlContext.read.parquet("file:///usr/local/spark/dataset/model/data/user/part-r-00000-7d55ba81-5761-4e36-b488-7e6214df2a68.snappy.parquet").toDF("id","features")
implicit class Rep(n: Int) {
def times[A](f: => A): Seq[A] = { 1 to n map(_ => f) }
}
val myHis = 13849.times { println("2.4848911616270923")}
Как сделать повторное значение в виде вектора и вычесть его?