Оценка с MOJO в en pyspark / jupyter - PullRequest
1 голос
/ 17 марта 2019

Я бы хотел оценить входящий конвейер данных в записной книжке Pyspark / Jupyter с помощью объекта mojo H2O.

from pyspark.sql import SparkSession
spark = SparkSession.builder \
                    .config("spark.executor.extraClassPath","/path/h2o-genmodel.jar") \
                    .config("spark.driver.extraClassPath","/path/h2o-genmodel.jar") \
                    .config("spark.jars","/path/h2o-genmodel.jar")
MojoModel = spark._jvm.hex.genmodel.MojoModel
EasyPredictModelWrapper = spark._jvm.hex.genmodel.easy.EasyPredictModelWrapper
RowData = spark._jvm.hex.genmodel.easy.Rowdata
mojo = MojoModel.load("mojo_path")

когда я бегу:

print(spark._jvm.hex.genmodel.MojoModel)

Я получаю «объект py4j.java_gateway.JavaPackage по адресу 0x7fb8ac768d30». Это говорит мне о том, что пакет был успешно загружен и увиден искрой?

Однако команда

mojo = MojoModel.load("mojo_path")

дает «Ошибка типа: объект JavaPackage не вызывается»

Пожалуйста, сообщите о других зависимостях или настройках конфигурации. Параметры конфигурации, которые я выбрал, основаны на нескольких других билетах stackoverflow.

...