Теперь есть конвейер, который включает IDF, CountVectorizer, ChiSqSelector, DecisionTreeClassifier. Я преобразовал этот конвейер, ошибка:
Feature 0 is marked as Nominal (categorical), but it does not have the number of values specified.
Я подумал, что конвейер создал разреженный вектор и поместил этот вектор в DecisionTreeClassifier, поэтому мне нужно преобразовать разреженный вектор в плотный вектор через этот конвейер, а затем подогнатьв DecisionTreeClassifier, как? Я отправил свой код:
val idf = new IDF()
val cvm = new CountVectorizer()
val selector = new ChiSqSelector()
val dt = new DecisionTreeClassifier()
val pipeline = new Pipeline()
val pipeline4 = Array[PipelineStage](cvm, idf, selector, dt)
val paramGrid4 = new ParamGridBuilder()
.addGrid(dt.maxDepth, Array(10))
.baseOn(pipeline.stages -> pipeline4)
val paramGrid = paramGrid4
val cv = new CrossValidator()
.setEvaluator(new BinaryClassificationEvaluator)
val cvModel = cv.fit(train)