У меня есть dataFrame с массивом структуры, поэтому я просто хочу отфильтровать столбцы, или мы можем сказать, выберите столбец в массиве структуры из массива структуры, но возможно ли это, поскольку я повторяю строку. Схема
root
|-- day: long (nullable = true)
|-- table_row: array (nullable = true)
| |-- element: struct (containsNull = true)
| |-- DATE: string (nullable = true)
| |-- ADMISSION_NUM: string (nullable = true)
| |-- SOURCE_CODE: string (nullable = true)
Я делаю итерацию по строкам. Можно ли выбрать столбцы массива по строкам. Я только хочу знать, как это возможно.
def keepColumnInarray(columns: Set[String], row: Row): Row = {
//Some
}
Пример. Если я хочу сохранить столбец «Данные», тогда keepColumnInarray выберет только эту
Схема вывода
root
|-- day: long (nullable = true)
|-- table_row: array (nullable = true)
| |-- element: struct (containsNull = true)
| |-- DATE: string (nullable = true)