Если я выполню запрос на перезапись вставки улья, как показано ниже, для сохранения данных в формате паркета, то имя столбца по умолчанию будет _col0. Как я могу избежать этого и применять имена столбцов, которые есть в предложении select.
ВСТАВИТЬ ПЕРЕКРЫТУЮ КАТАЛОГ "НЕКОТОРЫЕ-МЕСТО"
Хранится как паркет
ВЫБЕРИТЕ имя ОТ сотрудника;
- полученный файл паркета создается с именем столбца «_col0» вместо «name»
есть ли способ преодолеть эту проблему путем передачи некоторых свойств в serde?
hive> select * from employee;
OK
employee.id employee.name employee.salary
100 john doe 99999
101 jane doe 88888
hive> insert overwrite directory '/tmp/empdata' stored as parquet select name from employee;
scala> spark.read.parquet("/tmp/empdata").printSchema
root
|-- _col0: string (nullable = true)