Рассмотрим следующий код, который выполняет то, что говорит ваш вопрос. Он использует образец RDD, созданный для демонстрации этого. Вы можете применить аналогичные логи c к вашей проблеме.
val list = List((1 -> "Pune"),(2 -> "Mumbai"),(3 -> "Delhi"))
val rdd = sc.parallelize(list)
val filtered = rdd.filter{case (k,v) => (v.equals("Delhi"))}
// I HAVE USED collect as my RDD does not contain lot of data.
filtered.keys.collect