Мы используем внешнюю таблицу, когда наш базовый набор данных, на который указывает таблица улья, совместно используется многими целями, т. Е. Для задания сокращения карты, свиньи и т. Д., И используем управляемую таблицу в кусте, когда наш набор данных, указанный таблицей улья, используется только приложением улья.
На самом деле в управляемой таблице кустов есть полный контроль над набором данных, т. Е. В управляемой таблице, если вы отбросите набор данных таблицы, он также будет удален из хранилища кустов (/ usr / hive / warehouse), присутствующего в HDFS, но в случае внешней таблицы, когда вы отбрасываете таблицу, набор данных не удаляется из хранилища кустов в HDFS.
Предположим, к примеру, у вас есть набор данных объемом 50 ГБ, если вы создаете несколько копий набора данных для разных целей, это просто займет больше места, поэтому лучше использовать внешнюю таблицу, чтобы при удалении набора данных таблицы не удалялись и вы можете использовать его далее любым другим приложением, таким как свинья, или с любой другой целью.