У меня есть последовательность, как показано ниже:
val data = Seq("banagalore",
"Delhi.","","","","Mubmai","Kolkata","Jammu$Kashmir")
val rddData = ss.sparkContext.parallelize(data,3)
val output = rddData.flatMap(_.split(" "))
Итак, мое требование - напечатать нижний O / P 1. (слово, позиция слова в последовательности, количество символов в последовательности)
Eg:For Mumbai it will print("Mumbai",5,6)
5 = Позиция слова Мумбаи в Последовательности 6 = Количество символов в слове «Мумбаи»
Also,
O/p 2:Also I have to find out below:
(word,Position of the word in the sequence, Word with Maximum elements)
(word,Position of the word in the sequence, Word with Minimum characters