У меня есть фрейм данных Spark с тремя столбцами: a , b , c. Я хочу запустить накопительный пакет для каждого значения в a . Результат будет таким же, как и при запуске:
df.rollup('a','b','c')
Но без столбца с a=Null, b=Null, c=Null
. Я не хочу вычислять эту строку, потому что df разделен на a , и это очень дорого. Есть ли способ?