У меня есть датафрейм с более чем 400 столбцами.Большинство столбцов перекошены, т. Е. Значения большинства столбцов в строке в кадре данных в основном нулевые, за исключением нескольких столбцов (около 20)
Я планирую изменить эту структуру на
col1:Array[String]
col2:Array[String]
...
MapColumn: MapType {
key:String
value:Array[String]
}
Мне интересно, есть ли известное влияние на производительность при использовании колонки MapType с паркетом в искре?