Как мы можем сделать нормализацию z-счета в Pyspark? - PullRequest
0 голосов
/ 20 ноября 2018

В R мы можем стандартизировать фрейм данных с помощью функции масштабирования

    dfNormZ <- as.data.frame( scale(df[1:2] ))

Следующие данные печатаются как dfNormZ

  Age      Salary

1 -0.9271726 -1.03490978

2-0.1324532 0.07392213

3 1.0596259 0.96098765

Как я могу сделать то же самое в Pyspark?

...