Hive и impala - это два разных механизма запросов.Каждый механизм запросов уникален как с точки зрения архитектуры, так и производительности.Мы можем использовать Hive metastore для получения метаданных и выполнения запросов с использованием Impala.Обычный пример использования - подключение импалы / улья из таблицы.Если мы визуализируем улей из таблицы, мы можем получить самые последние данные без какой-либо обработки.Если мы будем продолжать загружать данные постоянно, метаданные также будут обновляться.Импала не знает об этих изменениях.Таким образом, мы должны выполнить запрос аннулирования метаданных, подключив impalad, чтобы обновить его состояние и синхронизировать с последней информацией, доступной в metastore.Таким образом, этот пользователь получит те же результаты, что и куст, когда запустит тот же запрос из таблицы, используя механизм impala.
Сейчас нет доступных параметров конфигурации для периодического выполнения этого запроса на аннулирование.Этот блог хорошо читает, чтобы периодически выполнять запрос на аннулирование метаданных через планировщик oozie для решения таких проблем, или просто мы можем установить cronjob с самого сервера.