Недавно Databricks запустил Databricks Connect
, что
позволяет писать задания с использованием собственных API Spark и выполнять их удаленно в кластере Azure Databricks, а не в локальном сеансе Spark.
Работает нормально, за исключением случаев, когда я пытаюсь получить доступ к файлам в Azure Data Lake Storage Gen2. Когда я выполню это:
spark.read.json("abfss://...").count()
Я получаю эту ошибку:
java.lang.RuntimeException: java.lang.ClassNotFoundException: Class shaded.databricks.v20180920_b33d810.org.apache.hadoop.fs.azurebfs.SecureAzureBlobFileSystem not found at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:2195)
Кто-нибудь знает, как это исправить?
Дополнительная информация: