От функции pyspark agg к int - PullRequest
0 голосов
/ 09 декабря 2018

Я считаю строки по условию на pyspark

df.agg(count(when((col("my_value")==0),True))).show()

Это работает, как я и ожидал.Тогда как мне извлечь значение, показанное в таблице, для хранения в переменной Python?

1 Ответ

0 голосов
/ 13 декабря 2018

Если вы просто хотите считать Trues (ceros), вам лучше сделать это:

from pyspark.sql import functions as F
pythonVariable = df.where(F.col('my_value') == 0).collect[0][0]

Как видите, нет необходимости менять ceros на True для их подсчета.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...