Обученная модель Xgboost с машинным обучением завершается неудачно при преобразовании df в h2o (блок данных).
Сбой для функции spark_app () при выполнении:
hf = H2OContext.getOrCreate(spark.spark_app())
Но это не так происходит всегда. Много раз он работает нормально и для пакетной работы, которую я запланировал запускать каждый день. По-прежнему происходит сбой, по крайней мере, один раз в неделю.
Журнал ошибок:
File "*/taskModel.py", line 304, in _sc_xgboost
hc = H2OContext.getOrCreate(spark.spark_app())
File "/databricks/python/lib/python3.5/site-packages/pysparkling/context.py",
line 170, in getOrCreate
h2o_connect_hook(h2o_context, verbose=verbose, **kwargs)
File "/databricks/python/lib/python3.5/site-packages/pysparkling/context.py",
line 119, in __default_h2o_connect
return h2o.connect(ip=h2o_context._client_ip, port=h2o_context._client_port,
**kwargs)
File "/databricks/python/lib/python3.5/site-packages/h2o/h2o.py", line 90, in
connect
verbose=verbose)
File "/databricks/python/lib/python3.5/site-
packages/h2o/backend/connection.py", line 323, in open
conn._cluster = conn._test_connection(retries, messages=_msgs)
File "/databricks/python/lib/python3.5/site-
packages/h2o/backend/connection.py", line 598, in _test_connection
raise H2OServerError("Cluster reports unhealthy status")
h2o.exceptions.H2OServerError: Cluster reports unhealthy status