Расчет плотности ядра каждого столбца в кадре данных Spark - PullRequest
0 голосов
/ 30 ноября 2018

Есть ли способ рассчитать KDE каждого столбца DataFrame?

У меня есть DataFrame, где каждый столбец представляет значения одного объекта.Для функции KDE Spark MLLib требуется RDD[Double] значений выборки.Проблема в том, что мне нужно найти способ, не собирая значения для каждого столбца, потому что это сильно замедлит работу программы.

У кого-нибудь есть идеи, как мне это решить?К сожалению, все мои попытки провалились до сих пор.

1 Ответ

0 голосов
/ 30 ноября 2018

Вероятно, вы можете создать новый СДР, используя функцию примера ( см. Здесь ), а затем выполнить свою операцию, чтобы получить оптимальную производительность.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...