Как добавить новую категориальную переменную во фрейм H2O - PullRequest
1 голос
/ 14 апреля 2019

Я пытаюсь добавить новую категориальную переменную во фрейм h2o.Я создал новую переменную, основанную на некоторых требованиях, и пытаюсь получить новые значения во фрейме h2o, но получаю ошибку.

Новая переменная, которую нужно добавить:

late_arrival <- with(flights,
 ifelse(arr_delay>=30,1,
 ifelse(arr_delay<30,0,NA)))
table(late_arrival)

Я пытаюсь изменить его в существующем кадре h2o, чтобы добавить эту новую переменную:

 flights_new <- select(flights.hex) %>%
mutate(late_arrival)

Ошибка в UseMethod ("select_"): нет применимого метода для 'select_', примененного к объектукласса "H2OFrame"

Я также попробовал collect function:

flights_new <- select (flights.hex, late_arrival) %>% collect()

Ошибка в UseMethod ("select_"): нет применимого метода для 'select_'применяется к объекту класса "H2OFrame"

Как добавить новую категориальную переменную в фрейм данных H2O?

1 Ответ

0 голосов
/ 14 апреля 2019

Вы либо делаете это изменение, прежде чем загружать данные в кластер H2O, либо вносите изменения внутри на стороне кластера H2O в вашем flight.hex. Ниже приведен пример с mtcars.

# change before loading data into h2o:
mtcars$new_condition <- ifelse(mtcars$mpg >= 20, 1, 
                               ifelse(mtcars$mpg <20, 0, NA))

library(h2o)
h2o.init()

mtcars.hex <- as.h2o(mtcars)

# change when data is inside h2o cluster
mtcars.hex$new_condition2 <- ifelse(mtcars.hex$mpg >= 20, 1, 
                                   ifelse(mtcars.hex$mpg <20, 0, NA))

mtcars.hex

   mpg cyl disp  hp drat    wt  qsec vs am gear carb new_condition new_condition2
1 21.0   6  160 110 3.90 2.620 16.46  0  1    4    4             1              1
2 21.0   6  160 110 3.90 2.875 17.02  0  1    4    4             1              1
3 22.8   4  108  93 3.85 2.320 18.61  1  1    4    1             1              1
4 21.4   6  258 110 3.08 3.215 19.44  1  0    3    1             1              1
5 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2             0              0
6 18.1   6  225 105 2.76 3.460 20.22  1  0    3    1             0              0

[32 rows x 13 columns]
...