Как и в случае любого другого ML Estimator
в Spark, ожидается, что inputCol
будет Vector
собранных функций.Перед применением Estimator
вы должны использовать инструменты из org.apache.spark.ml.feature
для извлечения, преобразования и сборки вектора объектов.
Вы можете проверить Как векторизовать столбцы DataFrame для алгоритмов ML? дляпример Pipeline
.