Как исключить процентили из резюме Спарк () - PullRequest
0 голосов
/ 20 мая 2019

Функция Spark summary() возвращает количество, среднее, стандартное отклонение и 25/50/75% процентили.

Возможно ли вычислить только count, mean и stddev?

1 Ответ

0 голосов
/ 20 мая 2019

Полагаю, вы говорите о функции summary () наборов данных.

В этом случае это должно работать:

yourDataset.summary( "count", "min", "stddev" ).show()

На основании https://spark.apache.org/docs/2.3.0/api/scala/index.html#org.apache.spark.sql.Dataset

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...