Разница между «groupby.apply» и «groupby.agg» - PullRequest
0 голосов
/ 05 июля 2019

Какая разница между 'groupby.apply'and'groupby.agg'? Почему обработанные данные отображаются как «NoneType»?

  1. Это для Spark 2.1.0 , Я хочу превратить столбец в несколько строк , Один и тот же столбец может быть связан с запятыми , Когда я использую groupby.apply, нет вывода, когда я использую groupby.agg, процедуры могут следовать как то, что я думаю.
  2. Я использую .count() процедур, но он показывает, что NoneType объект не имеет атрибута count.
data1=df.groupBy('_c0').agg(collect_list('_c1')).show()
print(data1.count())

data1=df.groupBy('_c0').apply(collect_list('_c1')).show()

Я хочу знать, сколько строк и столбцов процедур.

1 Ответ

0 голосов
/ 05 июля 2019

data1=df.groupBy('_c0').apply(collect_list('_c1')).show()

возвращает NoneType, поскольку show ничего не возвращает. Вот почему вы не можете подать заявку на это. Избавься от шоу. apply возвращает sql.DataFrame. О том, что вы пытаетесь сделать, см. этот вопрос SO

См. исходный код из show.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...