Все, что вы хотите проверить и изучить, см. В документации по pyspark API.Он будет иметь все возможные функции и соответствующие документы.В следующем примере я использовал least
для min
и greatest
для max
.
from pyspark.sql import functions as F
df = sqlContext.createDataFrame([
[1,3,2],
[2,3,6],
[3,5,4]
], ['A','B', 'C'])
df.withColumn(
"max",
F.greatest(*[F.col(cl) for cl in df.columns[1:]])
).withColumn(
"min",
F.least(*[F.col(cl) for cl in df.columns[1:]])
).show()
Pyspark API Link: - https://spark.apache.org/docs/1.6.2/api/python/pyspark.sql.html#pyspark.sql.DataFrame