Есть ли способ фильтровать или маркировать строки на основе массива Scala?
Имейте в виду, что в действительности количество строк намного больше.
пример данных
val clients= List(List("1", "67") ,List("2", "77") ,List("3", "56"),List("4","90")).map(x =>(x(0), x(1)))
val df = clients.toDF("soc","ages")
+---+----+
|soc|ages|
+---+----+
| 1| 67|
| 2| 77|
| 3| 56|
| 4| 90|
| ..| ..|
+---+----+
Я бы хотел отфильтровать все возрасты в массиве Scala, скажем,
var z = Array(90, 56,67).
df.where(($"ages" IN z)
или
df..withColumn("flag", when($"ages" >= 30 , 1)
.otherwise(when($"ages" <= 5, 2)
.otherwise(3))