Что означает «ограничено данными таблицы Hive» в справочнике Apache Sentry? - PullRequest
0 голосов
/ 08 ноября 2018

Здесь https://www.cloudera.com/documentation/enterprise/5-9-x/topics/sentry_intro.html
мы можем прочитать, что

Обзор Apache Sentry Apache Sentry - это гранулированная ролевая система модуль авторизации для Hadoop. Часовой предоставляет возможность контролировать и применять точные уровни привилегий для данных для аутентифицированные пользователи и приложения в кластере Hadoop. караул в настоящее время работает из коробки с Apache Hive, Hive Metastore / HCatalog, Apache Solr, Impala и HDFS (ограничено Hive данные таблицы) .

Что именно означает HDFS ограничена данными таблицы Hive ?

Означает ли это, что я не могу установить права доступа пользователей к определенным путям в HDFS?

Например, Я хотел бы установить доступ на чтение для user_A к пути /my_test1

и доступ для записи / чтения для user_B к пути /my_test1 и пути /my_test2.

Возможно ли это с Apache Sentry?

1 Ответ

0 голосов
/ 08 ноября 2018

Элементы управления Sentry не заменяют ACL HDFS. Синхронизация между разрешениями Sentry и ACL HDFS является односторонней; то есть плагин Sentry на NameNode будет применять разрешения Sentry вместе с ACL-списками HDFS, так что HDFS обеспечивает доступ к данным таблицы Hive в соответствии с конфигурацией Sentry, даже если к ним обращаются другие инструменты. Таким образом, контроль доступа HDFS является средством для обеспечения соблюдения политик, определенных в Sentry в таком случае.

Обеспечение произвольного доступа к файлам в HDFS по-прежнему должно осуществляться через ACL-списки HDFS.

...