Как конвертировать PySpark rdd в h2o RowData - PullRequest
0 голосов
/ 20 марта 2019

Я хотел бы преобразовать искровой DataFrame в формат RowData h2o.

Мой фрейм данных выглядит следующим образом:

+---+---+---+
|  a|  b|  c|
+---+---+---+
|  1|  2|  3|
+---+---+---+

Я хотел бы преобразовать его в эквивалентный формат, как показано ниже - но с использованием операций rdd для использования параллелизма. Это возможно в Python?

RowData = spark._jvm.hex.genmodel.easy.Rowdata
r=RowData()
r.put("a",1)
r.put("b",2)
r.put("c",3)
...