Блоки данных: разница между монтированием и прямым доступом к Data Lake Storage Gen 2 - PullRequest
4 голосов
/ 15 мая 2019

В чем разница между подключением Azure Data Lake Store Gen2 к блокам данных с использованием тарифа на обслуживание и прямого доступа с использованием ключа SAS?

Хочу узнать разницу в сроках передачи данных, безопасности доступа

Спасибо

1 Ответ

3 голосов
/ 09 июня 2019

Если вы монтируете хранилище, то все пользователи во всех кластерах получают доступ.

Если вы не монтируете и не подключаетесь напрямую в сеансе с использованием субъекта службы или SAS (я не думаю, что ключ SASофициально поддерживаемый BTW) пользователь в этом сеансе должен иметь доступ к учетным данным для создания соединения.

Принципы обслуживания также могут иметь низкие права доступа рычага, применяемые в пределах озера, такие как ограничение для определенных папок.

Обратите внимание, что с ADLS Gen2 у вас теперь есть возможность проходить через учетные данные пользователя: https://docs.azuredatabricks.net/spark/latest/data-sources/azure/adls-passthrough.html

Я не знаю каких-либо различий в производительности.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...