Мне нужна функция, которая будет принимать два файла в качестве входных данных и выводить наиболее общее слово между двумя файлами.
Например:
File1 = спасибо, спасибо, что вы
File2 = спасибо тебе ты
Выводом будет 'you', так как оно передается 2 раза. Моя текущая функция:
def sharedWord(a:String,b:String) : String ={
val aFile = sc.textFile(a);
val bFile = sc.textFile(b);
val flattenMapa = aFile.flatMap(line => line.split(" "));
val flattenMapb = bFile.flatMap(line => line.split(" "));
val mapreduceA = flattenMapa.map(word => (word.toLowerCase, 1)).reduceByKey((key,value) => key+value);
val mapreduceB = flattenMapb.map(word => (word.toLowerCase, 1)).reduceByKey((key,value) => key+value);
//not sure how to compare the two mapreduce collections of words
//val common = most shared word.
return common
}
Я застрял в том, как правильно сравнить два значения ключа карты-уменьшения