Не удается запустить параллельный поиск по сетке в H2O - PullRequest
0 голосов
/ 13 февраля 2020

Я пытаюсь использовать новую опцию «параллелизм» поиска по сетке H2O, чтобы настроить гиперпараметры модели GBM с 3-кратной перекрестной проверкой. Тем не менее, поиск не выполняется, или, скорее, просто останавливается, как только первая партия моделей построена.

Немного контекста: я отправляю это задание поиска по сетке в кластер H2O на удаленном сервере, на котором было oop. Я создаю кластер, скажем, с 5 узлами. Вот пример: hadoop jar /usr/local/h2o/bin28/h2odriver.jar -nodes 5 -mapperXmx 30g -baseport 54364 -disown. У меня есть столбец индикатора для назначения сгиба.

При parallelism = 0 поиск по сетке начинается с 5 параллельных моделей (сначала по 2 модели для каждой модели, а затем для 3-й модели для модели). Как только эти 5 моделей завершены, поиск только заканчивается.

Поиск по сетке работает нормально, если я запускаю его последовательно с отключенным параллелизмом, но я не могу понять, почему он не будет работать с параллелизмом ,

Буду признателен за любую помощь в этом. Спасибо!

РЕДАКТИРОВАТЬ: Исправление - похоже, опция "параллелизм = 1" тоже не работает. Поиск просто останавливается после одной модели. Это не было проблемой с предыдущей версией H2O - v3.26.03.

...