Если я правильно понимаю вопрос, вы хотите объединить 1-канальные изображения и 3-канальные изображения и получить 4-канальное изображение и использовать его в качестве входных данных.
Если это то, что вы хотите сделать, вы можете просто используйте torch.cat ().
Пример кода загрузки двух изображений и их объединения по размеру канала
import numpy as np
import torch
from PIL import Image
image_rgb = Image.open(path_to_rgb_image)
image_rgb_tensor = torch.from_numpy(np.array(image_rgb))
image_rgb.close()
image_grayscale = Image.open(path_to_grayscale_image))
image_grayscale_tensor = troch.from_numpy(np.array(image_grayscale))
image_grayscale.close()
image_input = torch.cat([image_rgb_tensor, image_grayscale_tensor], dim=2)
Я предположил, что изображение в градациях серого, которое вы хотите использовать, переведено в тензор с формой [..., ..., 1]
и изображением RGB до [..., ..., 3]
.