Без какой-либо предварительной обработки, безусловно, нет. Когда вы строите и обучаете свою нейронную сеть, вам нужно знать форму ввода. например: 25x25xn, где n - количество каналов.
То, что вы можете сделать, - это создать полностью сверточную нейронную сеть, чтобы вы могли вводить изображение nxn. Вот лучшее объяснение:
https://towardsdatascience.com/implementing-a-fully-convolutional-network-fcn-in-tensorflow-2-3c46fb61de3b
Другой подход заключается в обработке вашего ввода, чтобы получить нужную вам форму. В вашем случае вы можете скопировать и вставить серое изображение для двух других каналов или серое изображение RGB. Но вам нужно будет исправить входную форму.
На самом деле очень распространена предварительная обработка изображений перед их вводом в NN. Например, обрезка, изменение масштаба, оттенки серого, нормализация или даже фильтры, чтобы ваши входные изображения имели известную форму и были похожи на ваш тренировочный набор.