После запуска процесса длительного процесса (~ 2 часа) на экземпляре h2o (версия 3.24.0.2 (Hadoop)) скрипт python теряет соединение и выдает ошибки с сообщением
...
File "/home/osboxes/projects/ml1c/venv/local/lib/python2.7/site-packages/h2o/h2o.py", line 274, in init
raise H2OConnectionError('Can only start H2O launcher if IP address is localhost.')
H2OConnectionError: Can only start H2O launcher if IP address is localhost.
Проверка экземпляра h2o, который был запущен перед запуском скрипта, вывод терминала после нажатия enter
показывает
...
H2O node 172.18.4.62:54321 reports H2O cluster size 5 [leader is 172.18.4.62:54321]
H2O node 172.18.4.66:54321 reports H2O cluster size 5 [leader is 172.18.4.62:54321]
H2O node 172.18.4.65:54321 reports H2O cluster size 5 [leader is 172.18.4.62:54321]
H2O cluster (5 nodes) is up
(Note: Use the -disown option to exit the driver after cluster formation)
Open H2O Flow in your web browser: http://172.18.4.62:54321
(Press Ctrl-C to kill the cluster)
Blocking until the H2O cluster shuts down...
packet_write_wait: Connection to 172.18.4.62 port 22: Broken pipe
Кто-нибудь знает, что можно сделать, чтобы это исправить?
- Для контекста я обрабатываю большой фрейм данных pandas с помощью кусочков строки, преобразую их в h2o-фрейм данных и соединяю их обратно с привязкой строк
h2o.rbind
.