Я пытаюсь напечатать порог для значений данных, используя pyspark.
Ниже приведен код R, который я написал, но я хочу это в Pyspark, и я не могу понять, как это сделать в Pyspark. Любая помощь будет принята с благодарностью!
Значения dataframe выглядит примерно так:
values dataframe is
vote
0.3
0.1
0.23
0.45
0.9
0.80
0.36
# loop through all link weight values, from the lowest to the highest
for (i in 1:nrow(values)){
# print status
print(paste0("Iterations left: ", nrow(values) - i, " Threshold: ", values[i, w_vote]))
}
Я пытаюсь в pyspark, но я застрял здесь
for row in values.collect():
print('iterations left:',row - i, "Threshold:', ...)