Я очень привык к инфраструктуре h2o от R, но у меня возникли некоторые проблемы с настройкой некоторых аспектов h2o в python.
Я знаю, что вы можете создать копию фрейма данных pandas с помощью метода .copy (), чтобы при обновлении нового фрейма данных вы также не обновляли оригинальный. Имеют ли рамки h2o аналогичную функциональность? Что делает его еще более сложным, так это то, что кадры воды, похоже, не ведут себя в соответствии с правилами локальной / глобальной среды функций.
Ниже приведен пример, и кажется, что если бы только я мог создать .copy фрейма, или чтобы локальная среда функции не обновляла мою глобальную среду, это решило бы мою проблему. Если я создаю ту же самую вещь в R, то она ведет себя точно так, как ожидается, и фактически не изменяет столбец в моем исходном кадре h2o, так как я могу заставить python работать так же?
##### A FUNCTION TO CHANGE THE VALUE OF A COLUMN
def test_func(train_df,
var):
train_df[var] = train_df[var].log()
return(train_df)
##### TRY TO CREATE A NEW COPY OF THE FRAME WITH THE COLUMN CHANGED
new_df = test_func(train_df = old_df,
var = 'target')
##### THE COLUMN IN BOTH new_df AND old_df has both been changed.