Вы можете просто преобразовать в rdd
и использовать collectAsMap
df.rdd.map(x => (x.getInt(0), x.getString(1))).collectAsMap()
Это даст вам
scala> df.rdd.map(x => (x.getInt(0), x.getString(1))).collectAsMap()
res0: scala.collection.Map[Int,String] = Map(1231 -> aa, 1234 -> dd, 1236 -> cc, 1233 -> cc, 1232 -> bb, 1235 -> dd)
collectAsMap рекомендуется только тогда, когда ваши данные помещаются в драйвер.
Надеюсь, это поможет!