Я использую версию 2 для записи и сохранения фрейма данных, используя bucketBy
.
Таблица создается в Hive, но не с правильной схемой. Я не могу выбрать данные из таблицы улья.
(DF.write
.format('orc')
.bucketBy(20, 'col1')
.sortBy("col2")
.mode("overwrite")
.saveAsTable('EMP.bucketed_table1'))
Я получаю сообщение ниже:
Сохранение таблицы источника данных в виде корзины emp
. bucketed_table1
в метастафе Hive в специфическом формате Spark SQL, который НЕ совместим с Hive.
Схема улья создается следующим образом:
hive> desc EMP.bucketed_table1;
OK
col array<string> from deserializer
Как сохранить и записать фрейм данных в таблицу кустов, которую можно просмотреть позже?