h2o pojo на тестовых данных с дополнительными столбцами по сравнению с обученной моделью и иногда отсутствующими столбцами из набора данных поезда - PullRequest
0 голосов
/ 07 ноября 2018

Я создал свою модель POJO, я должен сохранять свои столбцы в том же порядке с тем же типом данных при генерации прогнозов с использованием Hive UDF? Какой самый чистый способ игнорировать дополнительные столбцы и добавить столбцы, которые присутствуют в наборе данных поезда, но отсутствуют в наборе тестовых данных, все мои столбцы либо двойные, либо длинные.

1 Ответ

0 голосов
/ 08 ноября 2018

Если вы используете упаковщик Easy, он делает это автоматически.

Если вы не используете оболочку Easy, вам нужно придумать такое же поведение.

В оболочке Easy новые столбцы игнорируются, а отсутствующие столбцы обрабатываются как н / д.

...