Проблемы с разрешениями ACL и Sentry для внешних каталогов данных таблиц кустов и обычных каталогов hdfs - PullRequest
0 голосов
/ 08 мая

В нашем кластере Cloudera Had oop существует два способа обеспечения безопасности HDFS и Hive.

  • Файлы HDFS защищены с помощью списков контроля доступа (ACL).
  • Базы данных улья контролируются ролями в часовом.

У нас есть обычные наборы данных HDFS и наборы данных внешних таблиц улья в одном общем пути hdfs (/ prod / output /).

HDFS необходимо знать, какие каталоги содержат таблицы Hive (sentry.hdfs.integration.path.prefixes), чтобы позволить часовому управлять списками ACL HDFS.

Я не могу установить ACL для управления содержимым HDFS на / prod / output без вмешательства в Hive.

Нужно ли нам высокоуровневое разделение между каталогами таблиц Hive и каталогами HDFS, чтобы избежать конфликта проблем с разрешениями?

...