Узел кластера H2O ведет себя медленно - PullRequest
0 голосов
/ 20 сентября 2018

Я запускаю пакет R h2o версии 3.20.0.2 в кластере Azure.

После установки многих моделей H2O кластер H2O, похоже, перестает отвечать на запросы с этим сообщением об ошибке:

Предупреждение в .h2o .__ checkConnectionHealth (): узел кластера H2O 127.0.0.1:54321 работает медленно и должен проверяться вручную.

Я попытался сбросить кластер с помощью h2o.shutdown() но проблема сохраняется и h2o.init() не удается.Без прав администратора, как я могу по-настоящему перезапустить сервер h2o и как избежать этой проблемы в будущем?

1 Ответ

0 голосов
/ 20 сентября 2018

Наиболее распространенная причина этого заключается в том, что вы использовали всю память в кластере.

В число опций входит выполнение таких действий, как:

  • с просьбой увеличить размер кластера при запускеон
  • вызывает h2o.rm или h2o.removeAll для удаления объектов в памяти, чтобы освободить пространство

h2o.shutdown () использует вызов API для серверной части для создания кооперативазавершение работы, но если бэкэнд уже в плохом состоянии, он может не работать.

Если вы запускаете R на том же хосте, что и сервер H2O, вы можете делать что-то вроде system («ps -ef»)в R запустить команды оболочки linux и попытаться исправить это, даже без прямой подсказки терминала.Найдите процесс h2o java и убейте его.

...