Зачем мне передавать результаты прогноза для сериализации при вызове serializeToBundle - PullRequest
0 голосов
/ 15 февраля 2019

Я не могу найти пример, который показывает, что модель Spark ML сохраняется - для обработки с mleap позже - без прогнозируемого Spark фрейма данных.

Каково значение этого фрейма данных и почемунужно ли сохранять модель?

Пример:

fittedPipeline.serializeToBundle("jar:file:/tmp/pyspark.example.zip", fittedPipeline.transform(df2))
...