Я использую Spark2.0.0 в моей среде разработки. Я создал объект SparkSession, как показано ниже
spark = SparkSession().getOrCreate()
Image = spark.read.json()
Я могу использовать вышеупомянутую SparkSession для чтения файлов json. Но есть ли способ прочитать файл изображения (PNG, JPG)? Я попытался найти документ spark 2.0, но об этом ничего не было сказано.
Моя основная цель - загрузить изображения в формате DF из какого-либо локального хранилища / HDFS через
Image = spark.read.()
и сохраните их в виде последовательного файла в папке HDFS для обработки изображений.
Как мы можем выполнить эту задачу? Любая помощь будет принята с благодарностью.