Выделить Select (). Количество () является фреймом данных pyspark? - PullRequest
1 голос
/ 20 сентября 2019

Я видел

df.select(“name”).distinct().count() <br/>

это фрейм данных pyspark?или фрейм данных панд?

1 Ответ

0 голосов
/ 20 сентября 2019

count () - это действие в искре, поэтому вы получите счетчик фрейма данных искры.

К вашему сведению, выберите и различите преобразования, которые вернут вам фрейм данных.Поскольку искра следует за ленивым вычислением, вычисление (в большинстве случаев) в искре не происходит, пока вы не вызовете действие.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...