В документации NVIDIA о смешанной точности обучения указано, что входные каналы должны быть кратны 8, чтобы включить тензорные ядра.Рекомендуется для первого слоя, который обычно имеет канал 1 (в градациях серого) или 3 (rgb), чтобы заполнить каналы до C = 4 и с шагом 2. Как должен быть формат входного тензора, чтобы включить смешанную точность обучения?Приведите пример с использованием кода tenorflow