У меня есть список scala List[Any] = List("a", "b",...)
, и мне нужно получить кадр данных Spark, состоящий из единственной строки со всеми столбцами в списке.Я пытаюсь создать RDD из этого с sc.parallelize(myList)
, которые возвращают org.apache.spark.rdd.RDD[Any] = ParallelCollectionRDD[5834] at parallelize at <console>:81
, но затем я не могу выбрать отдельные элементы этой строки: sc.parallelize(myList).map(line => line(0))
возвращает error: Any does not take parameters
и я не могу использовать toDF()
для получения моего DataFrame
value toDF is not a member of org.apache.spark.rdd.RDD[Any]
Я полагаю, что это как-то связано с типом Any, но мне нужно допустить любой тип, так как я не знаю, что я буду получать в моем списке