У меня есть набор данных, подобный следующему:
Input Dataset
Id, Parent_id, Data
-----------------------
1, NULL, favorite: 3
2, NULL, favorite: 4
Output Dataset
Id, Parent_Id, Data
------------------------
1, NULL, favorite: 3
1_t1, 1, favorite: 3
1_t2, 1, favorite: 3
1_t3, 1, favorite: 3
2, NULL, favorite: 4
2_t1, 2, favorite: 4
2_t2, 2, favorite: 4
2_t3, 2, favorite: 4
2_t4, 2, favorite: 4
Как вы можете видеть выше, я пытаюсь разбить свойство любимых счетчиков столбцов данных на их отдельные строки и используяСтолбец parent_id представляет его корневую запись.
До сих пор я пытался использовать функцию Spark SQL Explode, чтобы попытаться сделать это, но я не смог заставить ее работать.