При создании внешней таблицы или выполнении восстановления / восстановления разделов с этой конфигурацией:
set hive.stats.autogather=true;
Hive сканирует каждый файл в расположении таблицы, чтобы получить статистику, и это может занять слишком много времени.
Решение состоит в том, чтобы отключить его перед созданием / изменением таблицы / восстановлением разделов
set hive.stats.autogather=false;
См. Эти связанные заявки: HIVE-18743 , HIVE-19489, HIVE-17478
Если вам нужна статистика, вы можете собирать статистику только для новых разделов, если это необходимо, используя
ANALYZE TABLE [db_name.]tablename [PARTITION(partcol1[=val1], partcol2[=val2], ...)]
COMPUTE STATISTICS
См. Подробности здесь: ANALYZE TABLE
Также, если вы знаете, какие разделы следует добавить, используйте ALTER TABLE ADD PARTITION - вы можете добавить множество разделов в одну команду.