PYSPARK: применить квантильный дискретизатор для всех столбцов - PullRequest
0 голосов
/ 06 марта 2019

Предположим, у меня есть 1000 столбцов. Как применить QuantileDiscretizer для всех столбцов?

Это похоже на следующее для дискретизации одного столбца:

result_discretizer1 = QuantileDiscretizer(numBuckets=2, 
inputCol="I1",outputCol="result1").fit(df).transform(df)
result_discretizer1.show()

+---+----+---+---+---+-------+
| id|  I1| I2| I3| I4|result1|
+---+----+---+---+---+-------+
|1.0|1.23|2.5|3.9|5.0|    1.0|
|2.0|1.23|2.5|3.9|6.0|    1.0|
|3.0|1.23|5.8|9.0|6.0|    1.0|
|4.0|1.23|2.5|3.9|6.0|    1.0|
+---+----+---+---+---+-------+

что, если я хочу применить QuantileDiscretizer для всех столбцов и получить все дискретизированные столбцы в качестве выходных данных?

...