У меня есть два набора данных в формате TSV. Я хочу прочитать оба файла TSV в spark scala и выполнить анализ. Файл 1 содержит данные августа, а файл 2 - данные сентября. Как мне прочитать оба файла TSV, используя scala в спарк и сохранить вывод в другой файл TSV. Я хочу использовать операцию пересечения на обоих RRD
Ниже приведены два формата файла TSV. Файл 1
![enter image description here](https://i.stack.imgur.com/L3bIY.png)
Файл 2
![enter image description here](https://i.stack.imgur.com/I4zoi.png)
Выходной файл должен иметь App_Name, к которому обращаются оба месяца.
Выходные данные файла.
![enter image description here](https://i.stack.imgur.com/ZEpnR.png)