У меня есть файл JSON, который я сохранил в BLOB-объекте.Я хочу прочитать этот файл как словарь.Для нормальной файловой системы я бы сделал это следующим образом:
with open(file_path) as f:
data = json.load(f)
Но когда я даю URL-адрес большого двоичного объекта, он не работает.Я могу использовать функции pyspark для чтения из BLOB-объекта и преобразования его в json, как показано ниже -
df=spark.read.json(file_url)
data = list(map(lambda row: row.asDict(True), df.collect()))[0]
Мне интересно, могу ли я сделать это простым способом, как описано выше, так как операции сбора немного дороже вискры.