Как получить значения столбца Spark Dataframe, имеющего собственные дочерние элементы? - PullRequest
1 голос
/ 17 июня 2020

У меня есть Dataframe со следующей схемой -

root
|--country: struct (nullable = true)
|  |--state: struct (nullable = true)
|  |  |--city: string (nullable = true)
|  |--capital: string (nullable = true)
|  |--language: string (nullable = true)
|  |  |--script: string (nullable = true)

Я хочу извлечь значения только country в список, но когда я это сделаю, дети тоже появятся. Есть ли способ получить только значения country, а не его дочерние элементы?

EDIT: добавлен вывод printSchema () выше. Если у меня есть country = "USA" с State = "California", "NY"; capital = "Вашингтон D C"; и так далее, я хочу извлечь значение «USA», не принимая никаких других значений.

...