smruthi kilari 20 ноября 2018 12

Как мы можем сделать нормализацию z-счета в Pyspark?

smruthi kilari / 20 ноября 2018

В R мы можем стандартизировать фрейм данных с помощью функции масштабирования

    dfNormZ <- as.data.frame( scale(df[1:2] ))

Следующие данные печатаются как dfNormZ

  Age      Salary

1 -0.9271726 -1.03490978

2-0.1324532 0.07392213

3 1.0596259 0.96098765

Как я могу сделать то же самое в Pyspark?

...

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.