Контролирует ли Sentry доступ к файлам HDFS для клиентов, использующих протокол HDFS? - PullRequest
1 голос
/ 22 января 2020

Sentry Apache описывает Sentry следующим образом:

Sentry в настоящее время работает из коробки с Apache Hive, Hive Metastore / HCatalog, Apache Solr, Impala и HDFS (ограничено данными таблицы Hive).

В документах также показано изображение, которое предлагает приложения, которые обращаются к HDFS напрямую, не будут использовать Sentry и вместо этого использовать файл ACL - мое понимание верно ?

enter image description here

1 Ответ

1 голос
/ 24 января 2020

Вы понимаете из документа правильно.

Например, для Hive данные, связанные с управляемыми таблицами, хранящимися в пути HDFS /user/hive/warehouse (по умолчанию), будут принадлежать hive: hive (пользователь: группа), если включен Sentry. Таким образом, другие пользователи будут ограничены в доступе к файлам в этих каталогах, кроме пользователей, которым разрешен доступ с использованием правил Sentry.

Данные, которые существуют вне этого пути HDFS по умолчанию в Hive, т. Е. Обычно связанные данные с внешней таблицей и другими данными в HDFS все еще можно получить доступ в обычном режиме, минуя Sentry, так как они не управляются Sentry по умолчанию.

Итак, если мы хотим записать данные в один из этих каталогов с помощью запроса Hive в кластеру с включенным Sentry, нам нужно назначить необходимые привилегии для роли, назначенной группе (группе, в которую входит пользователь, выполняющий запрос).

Надеюсь, это поможет!

Подробнее о правилах охраны ЗДЕСЬ

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...