У меня есть способ получить подмножество данных, которое работает:
This works
val subset_cols = {joinCols :+ col}
val df1_subset = df1.select(subset_cols.head, subset_cols.tail: _*)
Это не работает. Код компилируется, но я получаю ошибку во время выполнения.
val subset_cols = {joinCols :+ col}
val df1_subset = df1.select(subset_cols.deep.mkString(","))
Ошибка:
Exception in thread "main" org.apache.spark.sql.AnalysisException:
cannot resolve '`first_name,last_name,rank_dr`' given input columns:
[model, first_name, service_date, rank_dr, id, purchase_date,
dealer_id, purchase_price, age, loyalty_score, vin_num, last_name, color];;
'Project ['first_name,last_name,rank_dr]
Я пытаюсь передать subset_cols методу .select, но, похоже, мне не хватает какого-то форматирования.