Таблица исходных данных
/Company/Engineering/DataTeam 45
/Company/Engineering/Mobile 50
Таблица выходных данных
/Company 45
/Company/Engineering 45
/Company/Engineering/DataTeam 45
/Company 50
/Company/Engineering 50
/Company/Engineering/MobileTeam 50
Так что мой вопрос в основном заключается в том, что, глядя на приведенную выше таблицу исходных и выходных данных, преобразование исходной таблицы в таблицу выходных данных, как я могу добиться этого с помощью spark sql.
Я не мог использовать UDF, потому что с UDF вы не можете возвращать строки. Поэтому следующим моим шагом было создание фрейма данных в памяти и добавление строк с использованием UDF. Но проблема этого подхода заключается в том, что во фрейме данных будет более миллиарда строк, и я не уверен, что это вообще возможно.
Любые предложения о том, как я могу добиться этого с помощью spark sql?