Кластер H2O неожиданно отключается;packet_write_wait: подключение к порту xxx.xxx.xx.xx 22: сломанный канал - PullRequest
0 голосов
/ 11 июня 2019

После запуска процесса длительного процесса (~ 2 часа) на экземпляре h2o (версия 3.24.0.2 (Hadoop)) скрипт python теряет соединение и выдает ошибки с сообщением

...
File "/home/osboxes/projects/ml1c/venv/local/lib/python2.7/site-packages/h2o/h2o.py", line 274, in init
    raise H2OConnectionError('Can only start H2O launcher if IP address is localhost.')
H2OConnectionError: Can only start H2O launcher if IP address is localhost.

Проверка экземпляра h2o, который был запущен перед запуском скрипта, вывод терминала после нажатия enter показывает

...
H2O node 172.18.4.62:54321 reports H2O cluster size 5 [leader is 172.18.4.62:54321]
H2O node 172.18.4.66:54321 reports H2O cluster size 5 [leader is 172.18.4.62:54321]
H2O node 172.18.4.65:54321 reports H2O cluster size 5 [leader is 172.18.4.62:54321]
H2O cluster (5 nodes) is up
(Note: Use the -disown option to exit the driver after cluster formation)

Open H2O Flow in your web browser: http://172.18.4.62:54321

(Press Ctrl-C to kill the cluster)
Blocking until the H2O cluster shuts down...
packet_write_wait: Connection to 172.18.4.62 port 22: Broken pipe

Кто-нибудь знает, что можно сделать, чтобы это исправить?

  • Для контекста я обрабатываю большой фрейм данных pandas с помощью кусочков строки, преобразую их в h2o-фрейм данных и соединяю их обратно с привязкой строк h2o.rbind.
...