Это, вероятно, связано с ошибкой HW C, о которой сообщают несколько пользователей здесь .
Я обнаружил, что она возникает, только если вы пытаетесь использовать partitionBy
при записи, например:
df.write.partitionBy("part")
.mode(SaveMode.Overwrite)
.format(com.hortonworks.hwc.HiveWarehouseSession.HIVE_WAREHOUSE_CONNECTOR)
.option("table", "`default`.`testout`").save;
В другой заметке, если вы удалите кусок partitionBy
, разбиение будет работать как положено (так как информация о разделе уже хранится в таблице Hive), но если вы используете режим перезаписи (а не, например, добавление), HW C удалит и заново создаст вашу таблицу и не будет повторно применять информацию о секционировании.