Задача не сериализуемая Spark / Scala - PullRequest
0 голосов
/ 06 марта 2020

Я сделал этот код, и я всегда получаю эту ошибку на линии

val randomForestModel = randomForestClassifier.fit(trainingData)

код:

val seed = 5043
val Array(trainingData, testData) = labelDf.randomSplit(Array(0.7, 0.3), seed)
trainingData.cache()
testData.cache()

// train Random Forest model with training data set

 val randomForestClassifier = new RandomForestClassifier()
.setImpurity("gini")
.setMaxDepth(3)
.setNumTrees(20)
.setFeatureSubsetStrategy("auto")
.setSeed(seed)

val randomForestModel = randomForestClassifier.fit(trainingData)

println(randomForestModel.toDebugString)

Ошибка:

ERROR Instrumentation: org.apache.spark.SparkException: Task not serializable
...