Предположим, что у нас есть python словарь, подобный следующему:
dict = {"person1" : (20, 17, 157, 31, 35), "person2" : (29 , 11) , "person3" : (200, 100 , 11)}
как создать DataFrame в pyspark из этого словаря, который имеет строковые ключи и кортеж с различными размерами в качестве значения?
Мой желаемый вывод выглядит следующим образом:
key | value
-------------------------------------
person1 | (20, 17, 157, 31, 35)
------------------------------------
person2 | (29 , 11)
-------------------------------------
person3 | (200, 100 , 11)
Я пытался сделать это с помощью этого кода:
df = pd.DataFrame(dict)
ddf = spark.createDataFrame(df)
, но это выдает ошибку значения следующим образом:
ValueError: все массивы должны быть одинаковой длины
Кто-нибудь может мне посоветовать?