Я изучил следующее git-репо (https://github.com/h2oai/h2o-tutorials/blob/master/tutorials/glrm/glrm.census.labor.violations.ipynb).. Это показывает, что мы можем использовать GLRM для уменьшения размера. Есть код как:
from h2o.estimators.glrm import H2OGeneralizedLowRankEstimator
acs_model = H2OGeneralizedLowRankEstimator(k = 10,
transform = "STANDARDIZE",
loss = "Quadratic",
regularization_x = "Quadratic",
regularization_y = "L1",
gamma_x = 0.25,
gamma_y = 0.5,
max_iterations = 100)
acs_model.train(x = acs_full.names, training_frame= acs_full)
print(acs_model)
zcta_arch_x = h2o.get_frame(acs_model._model_json["output"]["representation_name"])
zcta_arch_x.head()
В примере показано, что мы можем получить уменьшенное измерение zcta_arch_x для таблицы acs_full . Предполагается, что acs_full является набором обучающих данных. Можем ли мы использовать эту обученную модель acs_model для преобразования новых тестовых данныхустановить, чтобы получить уменьшенное измерение для набора тестовых данных?