Обычно мы используем расположение файла Had oop в таблице кустов для доступа к данным из наших искровых ETL. Есть ли какие-либо преимущества использования Hive Warehouse Connector вместо нашего нынешнего подхода? И есть ли какой-либо недостаток использования коннектора Hive Warehouse для ETL?
Я не могу вспомнить недостаток.
Hive хранит схему и обеспечивает более быстрые предикаты pu sh downs. Если вы читаете из файловой системы, вам придется часто определять схему самостоятельно