сводная таблица с дублирующимися записями без агрегирования / группировки с использованием scala и spark-sql - PullRequest
1 голос
/ 24 апреля 2019

У меня есть ситуация, аналогичная описанной в этом вопросе.

Но мой полный проект находится в Scala, и я бы предпочел использовать API-интерфейсы scala / spark-sql для времени и времени.ограничения на создание и развертывание пакетов.

Есть ли у нас метод, подобный pandas.DataFrame.unstack в Scala?Или есть какой-то другой способ добиться этого, скажем, некоторые UDF?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...