В нашем кластере Cloudera Had oop существует два способа обеспечения безопасности HDFS и Hive.
- Файлы HDFS защищены с помощью списков контроля доступа (ACL).
- Базы данных улья контролируются ролями в часовом.
У нас есть обычные наборы данных HDFS и наборы данных внешних таблиц улья в одном общем пути hdfs (/ prod / output /).
HDFS необходимо знать, какие каталоги содержат таблицы Hive (sentry.hdfs.integration.path.prefixes), чтобы позволить часовому управлять списками ACL HDFS.
Я не могу установить ACL для управления содержимым HDFS на / prod / output без вмешательства в Hive.
Нужно ли нам высокоуровневое разделение между каталогами таблиц Hive и каталогами HDFS, чтобы избежать конфликта проблем с разрешениями?