Question

Есть ли способ рассчитать KDE каждого столбца DataFrame?

У меня есть DataFrame, где каждый столбец представляет значения одного объекта.Для функции KDE Spark MLLib требуется RDD[Double] значений выборки.Проблема в том, что мне нужно найти способ, не собирая значения для каждого столбца, потому что это сильно замедлит работу программы.

У кого-нибудь есть идеи, как мне это решить?К сожалению, все мои попытки провалились до сих пор.

H Roy · Answer 1 · 30 ноября 2018

Вероятно, вы можете создать новый СДР, используя функцию примера ( см. Здесь ), а затем выполнить свою операцию, чтобы получить оптимальную производительность.

Расчет плотности ядра каждого столбца в кадре данных Spark

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Расчет плотности ядра каждого столбца в кадре данных Spark

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы