Как получить среднее значение логического столбца в PySpark? - PullRequest
0 голосов
/ 18 июня 2019

Я пытался использовать .agg(avg("boolean_column")), но получил ошибку:

"function average requires numeric types, not boolean"

Как получить среднее значение для такого столбца?

1 Ответ

1 голос
/ 18 июня 2019

Преобразовать столбец в числовой тип, затем взять среднее значение:

from pyspark.sql.functions import avg, col
df.groupBy(...).agg(avg(col("boolean_column").cast("double")))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...