Как использовать внешний стол в улье? - PullRequest
0 голосов
/ 26 апреля 2018

Может кто-нибудь объяснить, почему и где мы используем внешние таблицы в улье?

Пожалуйста, объясните сценарий, чтобы легко понять.

Ответы [ 3 ]

0 голосов
/ 27 апреля 2018

Как правило: используйте внешнюю таблицу, если вы планируете работать с этими данными не только из Hive, но и из других платформ. В противном случае сделайте его внутренним.

0 голосов
/ 29 апреля 2018

Единственная разница между внешней и управляемой таблицами в Hive - это поведение Drop table или Drop partition. Для Managed он также удалит данные, для внешней таблицы данные останутся нетронутыми в расположении таблицы / раздела.

Используйте Внешний в большинстве случаев. Внешняя таблица позволяет легко изменять определение таблицы. Также вы можете создать несколько таблиц поверх одной и той же локации. Используйте управляемую таблицу, если таблица временная / промежуточная и данные должны быть удалены на свободное место.

Управляемую таблицу можно преобразовать во внешнюю и наоборот с помощью

alter table table_name SET TBLPROPERTIES('EXTERNAL'='TRUE');
0 голосов
/ 26 апреля 2018

Мы используем внешнюю таблицу, когда наш базовый набор данных, на который указывает таблица улья, совместно используется многими целями, т. Е. Для задания сокращения карты, свиньи и т. Д., И используем управляемую таблицу в кусте, когда наш набор данных, указанный таблицей улья, используется только приложением улья.

На самом деле в управляемой таблице кустов есть полный контроль над набором данных, т. Е. В управляемой таблице, если вы отбросите набор данных таблицы, он также будет удален из хранилища кустов (/ usr / hive / warehouse), присутствующего в HDFS, но в случае внешней таблицы, когда вы отбрасываете таблицу, набор данных не удаляется из хранилища кустов в HDFS.

Предположим, к примеру, у вас есть набор данных объемом 50 ГБ, если вы создаете несколько копий набора данных для разных целей, это просто займет больше места, поэтому лучше использовать внешнюю таблицу, чтобы при удалении набора данных таблицы не удалялись и вы можете использовать его далее любым другим приложением, таким как свинья, или с любой другой целью.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...