У меня проблемы с чтением изображений в Pyspark.Я вытащил следующее из примера программы.Когда я запускаю код, кажется, что он возвращает одномерный массив вместо правильных данных.
Есть ли параметр, который мне нужно настроить для правильной работы?
df = ImageSchema.readImages('path')
data = df.take(4)
for i in range(0,4):
im = data[i][0]
print("image index: {}".format(i))
print("image type: {}, number of fields: {}".format(type(im), len(im)))
print("image path: {}".format(im.origin))
print("height: {}, width: {}, Mode: {}".format(im.height, im.width, im.mode))
print('Channels: {}'.format(im.nChannels))
print("\n")
Возвращает:
image index: 0
image type: <class 'pyspark.sql.types.Row'>, number of fields: 6
image path: 'path'
height: 1024, width: 1280, OpenCV type: 0
Channels: 1