Учитывая, что код обычно отправляется с граничного узла, я бы предложил ограничить доступ по SSH для определенных пользователей, а затем разделить HDFS хотя бы на учетные записи пользователей ... HDFS уже имеет каталог /user
, поэтому начнем с него.
Hortonworks, по крайней мере, помещает общие файлы для Hive в /apps/hive/
, Spark в /apps/spark
и т. Д. Таким образом, есть место для размещения общих библиотек.
Если у вас есть специфичные для проекта файлы, которые нельзя поместить в один каталог, и вам нужны более мелкие ACL, чем в пользовательских каталогах, тогда /projects
или просто новые папки в корне HDFS должны подойти.
Подход OCD для разделения полностью изолированных проектов заключается в настройке Федерации HDFS и пространств имен , где у вас будет NameNode для каждой крупной инициативы в компании.