Я пытаюсь сделать машинное обучение на наборе данных файлов PNG. Я загружаю данные с Подушки, и я получаю это прекрасное изображение с Подушки . Тем не менее, когда я загружаю данные с помощью Torchvision, я получаю гораздо более противное представление, где исходный шаблон мозаично 9 раз на втором изображении . Обрезка изображения для компенсации выглядит как коп, и мне бы очень хотелось понять, что здесь происходит.
Код для первого изображения:
image = Image.open(root_dir + img_name, 'r')
imshow(np.asarray(image))
Код для получить второе изображение выглядит следующим образом:
tensor = TF.to_tensor(image)
img = tensor.resize_((200, 200, 3))
img = img.numpy()
plt.imshow(img)
Мне кажется, что изображение имеет только 3 канала и Torchvision обрабатывает это правильно. Также размеры выходного тензора составляют (3, 200, 200)
. Это все до нормализации или вообще какой-либо обработки. Помощь высоко ценится.