Мне нужно найти одинаковые слова в двух файлах.Я использую искру, Java.
Задача: Для двух текстовых файлов подсчитать количество слов, которые встречаются одновременно в первом и во втором файле.Результат сохраняется в файле в виде пар ключ-значение, где ключ - это число общих слов, значение - само слово.
вопрос: как это сделать правильно?Сначала я нахожу слова и количество вхождений этого слова в первом файле, используя wordcount, аналогично второму файлу.Как объединить их, оставляя только общее между первым и вторым?
Я присоединяюсь к ним и получаю вот это: (test, (1,1)) (spark, (1,2))
Мне нужно получить как минимум два значения, т.е. (тест, 1) (искра, 1)
Как это сделать правильно?
Мой код редактирования