Во-первых, единственный верный способ обеспечить безопасность в Hadoop - это включить Kerberos. Затем выполните аудит всех действий HDFS в отношении ваших конфиденциальных данных.
Но это не будет работать, если кто-то имеет прямой доступ к hdfs или даже если кто-то использует Spark
Если у вас есть пользователи, выдающие себя за других через HADOOP_USER_NAME
, тогда они могут иметь доступ к вещам, но списки ACL HDFS должны быть в состоянии предотвратить это.
В противном случае Ranger внедряет код в драйвер Hive (возможно, Spark) для маскировки / скрытия определенных столбцов. Если вы хотите запретить прямой доступ HDFS, вам нужно запретить SSH-доступ к серверу Hadoop или не распространять ключевые таблицы для доступа внешних клиентов для ненадежных сторон
Я не совсем уверен, что функция Атласа