Используйте функцию split
, затем взорвите массив , чтобы получить столбец категории.
Example:
#sample data
df=spark.createDataFrame([("abcd123","a,b,c")],["business_id","categories"])
from pyspark.sql.functions import *
df.withColumn("category",explode(split(col("categories"),","))).drop("categories").show()
#+-----------+--------+
#|business_id|category|
#+-----------+--------+
#| abcd123| a|
#| abcd123| b|
#| abcd123| c|
#+-----------+--------+