Если вы хотите использовать предварительно обученную модель, вы можете использовать только RGB, поскольку они только обучены понимать RGB.В этом случае, как вы сказали, разделите их и отбросьте глубину.
Для использования 4-канального изображения, подобного этому, вам необходимо переучивать сеть с нуля, а не загружать предварительно обученный набор весов.
Вероятно, вы получите хорошие результаты, используя ту же архитектуру, что и для 3-канальных изображений (за исключением незначительного изменения, необходимого для поддержки 4-канального входа), поэтому переподготовка не должна быть очень сложной.