У меня есть два набора данных в формате TSV. Я хочу прочитать оба файла TSV в spark scala и выполнить анализ. Файл 1 содержит данные августа, а файл 2 - данные сентября. Как мне прочитать оба файла TSV, используя scala в спарк и сохранить вывод в другой файл TSV. Я хочу использовать операцию пересечения на обоих RRD
Ниже приведены два формата файла TSV. Файл 1
Файл 2
Выходной файл должен иметь App_Name, к которому обращаются оба месяца.
Выходные данные файла.