Если у вас уже есть файл AVRO, загрузите файл в HDFS в каталог по вашему выбору. Затем создайте внешнюю таблицу поверх каталога.
CREATE EXTERNAL TABLE external_table_name(col1 string, col2 string, col3 string ) STORED AS AVRO LOCATION '<HDFS location>';
Затем создайте внутреннюю таблицу кустов поверх внешней таблицы для загрузки данных
CREATE TABLE internal_table_name(col2 string, col3 string) AS SELECT col2, col3 FROM external_table_name
Вы можете запланировать внутреннюю загрузку таблицы, используя пакетный скрипт на любом языке сценариев или инструментах.
Надеюсь, это поможет:)