Я новичок в Scala Spark.у меня есть данные текстового файла как
001,delhi,india
002,chennai,india
003,hyderabad,india
004,newyork,us
005,chicago,us
006,lasvegas,us
007,seattle,us
Я хочу подсчитать количество различных городов в каждой стране, поэтому я применил groupBy и mapGroups.Я не уверен, как считать значения внутри mapGroups. Пожалуйста, найдите мой код ниже
val ds1 = sparkSession.read.textFile("samplefile.txt").map(x => x.split(","))
val ds2 = ds1.groupByKey(x => x(2)).mapGroups{case(k,iter) => (k,iter.map(x => x(2)).toArray)}
Пожалуйста, помогите мне с синтаксисом.Я знаю, что это легко сделать с помощью spark-sql, но я хочу сделать это с помощью scala