Вот мой фрейм данных:
+--------------------+--------------------+
| core_id| movie_genres_upd|
+--------------------+--------------------+
|12f99f04-5168-438...|[Comedy, Mockumen...|
|32c7d12f-6bf2-4e5...|[Action, Blockbus...|
|9f067041-3b49-4db...|[Animation, Comed...|
|c6d203cb-afcf-4e8...|[Action, Adventur...|
|b02416f9-5761-48f...|[Adventure, Anima...|
Это мои типы данных:
[('core_id', 'string'), ('movie_genres_upd', 'array<string>')]
Я приведу более наглядный пример. Вот начальный фрейм данных:
id genres
1 ["comedy", "blockbuster"]
2 ["drama", "animation", "comedy"]
Желаемый фрейм данных:
id genres
1 "comedy"
1 "blockbuster"
2 "drama"
2 "animation"
2 "comedy"
Я новичок в pyspark, поэтому я борюсь с этим. Любая помощь приветствуется.