Я пытался создать Dataframe из списка кортежей в Scala, но у меня возникли проблемы.У меня есть мой список кортежей, таких как:
`mylist` = List((17988,2), (17988,54), (17988,41), (17988,1))
Это схема, которую я определил для двух столбцов:
val `outputSchema` =
StructType(
List(
StructField("SAILORID", StringType, nullable = false),
StructField("ACTIVITYID", StringType, nullable = true)))
Я попробовал приведенный ниже код, но он выдает исключение нулевого указателя.
val df = spark.createDataFrame(mylist, outputSchema);
Я также попробовал приведенное ниже, но та же проблема с нулевым указателем:
val rdd = spark.sparkContext.parallelize(mylist)
val df = rdd.toDF("name", "list")
df.show()
mylist = List((17988,2), (17988,54), (17988,41), (17988,1))
Это моя схема для Dataframe:
val outputSchema =StructType(List(StructField("SAILORID", StringType, nullable = false),StructField("ACTIVITYID", StringType, nullable = true)))
val df = spark.createDataFrame(mylist, outputSchema);
Я хочу получить результатв Dataframe из каждого кортежа в одной строке в приведенном выше списке.У меня должно быть 4 ряда из 4-х кортежей вроде:
------------------------
| SAILORID | ACTIVITYID |
|----------|------------|
| 17988 | 2 |
| 17988 | 54 |
| 17988 | 41 |
| 17988 | 1 |
-------------------------