Разрешения на файлы в HDFS - PullRequest
0 голосов
/ 01 июня 2018

Я нахожу множество учебников, которые направляют пользователей о том, как «создавать пользователей / группы» в HDFS.Интересно, что означает «владелец» или «группа» в контексте HDFS.

Кроме того, кто является владельцем или групповым пользователем файла, когда он находится в HDFS? Некоторые источники говорят, что это hdfs, а некоторые говорят, что это пользователь клиентского процесса.

Я хочу знать, чтобы был точный способ понять и исправить permission denied ошибок.

1 Ответ

0 голосов
/ 01 июня 2018

Как уже упоминалось в первой ссылке

Многие административные команды HDFS необходимо запускать как пользователь ОС «hdfs», который является суперпользователем HDFS по умолчанию

Суперпользователем по умолчанию часто является hdfs, но не обязательно.

... нет фиксированного суперпользователя для Hadoop.Системный суперпользователь для Hadoop - это просто пользователь операционной системы, который запускает NameNode.Суперпользователь HDFS не обязательно должен быть пользователем root узла NameNode

В HDFS нет настоящих «пользователей / групп».По умолчанию это все строки от пользователя вашей локальной ОС. Который может быть переопределен любым пользователем .Hadoop не имеет абсолютно никакой истинной авторизации без Kerberos.

Если вы включите разрешения, то hdfs dfs -ls и hdfs dfs -getfacl покажут вам разрешения для файлов.hdfs dfs -chown и hdfs dfs -chmod меняют их.

Любая созданная вами учетная запись пользователя HDFS должна существовать как пользователь OS (или PAM или LDAP) в namenode как минимум для любых разрешений, которые будут успешно подтверждены клиентами HDFS.

...