Предположим, у нас есть следующий DataFrame в (Py) Spark. (Я взял данные из этого вопроса .)
+----+--------+
| id|idAsLong|
+----+--------+
| 0| 0|
|null| null|
| 5| 5|
|null| null|
|null| null|
| -8| -8|
+----+--------+
Вопрос: Как определить / найти функцию smax
, которая не игнорирует null
. То есть .smax("isAsLong")
дает null
.
Этот вопрос возникает, когда я создаю сводную таблицу. А именно
df.groupBy("id").pivot("var").max("val")
дает таблицу, которая заполнена 0, даже если нет значения для вычисления.