Важное примечание: Несмотря на то, что DBFS root имеет возможность записи, мы рекомендуем хранить данные в хранилище подключенных объектов, а не в DBFS root.
Причина, по которой рекомендуется хранить данные в подключенной учетной записи хранения, а не в учетной записи хранения, находится в рабочей области ADB.
Reason1: У вас нет разрешения на запись, когда вы используете ту же учетную запись хранения извне через Storage Explorer.
Причина 2: Вы не может использовать те же учетные записи хранения для другой рабочей области ADB или использовать ту же службу, связанную с учетной записью хранения, для Azure фабрики данных или Azure рабочей области synapse.
Причина 3: В будущем вы решили использовать Azure рабочие пространства Synapse вместо ADB.
Причина 4: Что, если вы хотите удалить существующее рабочее пространство.
Файловая система Databricks (DBFS) - это распределенная файловая система, подключенная к рабочему пространству Azure Databricks и доступная в кластерах Azure Databricks. DBFS - это абстракция поверх масштабируемого хранилища объектов, то есть ADLS gen2.
Нет ограничений на объем данных, которые вы можете хранить в Azure Data Lake Storage Gen2.
Примечание : Azure Data Lake Storage Gen2 может хранить и обслуживать много эксабайт данных.
Для Azure файловой системы Databricks (DBFS) - Поддерживаются только файлы размером менее 2 ГБ .
Примечание: Если вы используете API-интерфейсы ввода-вывода локальных файлов для чтения или записи файлов размером более 2 ГБ вы можете увидеть поврежденные файлы. Вместо этого обращайтесь к файлам размером более 2 ГБ с помощью интерфейса командной строки DBFS, dbutils.fs или Spark API или используйте папку / dbfs / ml.
Для Azure Хранилище - Максимум емкость учетной записи хранения составляет 5 ПиБ Петабайт.
В следующей таблице описаны ограничения по умолчанию для Azure универсальных учетных записей v1, v2, хранилища BLOB-объектов и учетных записей хранения блочных BLOB-объектов. Предел входящего трафика относится ко всем данным, которые отправляются в учетную запись хранения. Предел исходящего трафика относится ко всем данным, полученным от учетной записи хранения.
Примечание. Ограничение на единичный блочный BLOB-объект 4,75 ТБ .