У меня есть СДР, например:
rdd = sc.parallelize(['a','b','a','c','d','b','e'])
Я хочу создать карту (словарь) каждого уникального значения для индекса.
Вывод будет карта (ключ, значение) вроде:
{'a':0, 'b':1, 'c':2,'d':3,'e':4}
Это очень легко сделать в Python, но я не знаю, как это сделать в Spark.