Я хочу узнать фактическое значение TFLOP моего графического процессора при выполнении DeepLearning.
Есть ли способ найти операции с плавающей запятой, необходимые для обучения такой модели, как ResNet50?
Я нашел несколько способов в Интернете, чтобы определить провалы для вывода (одно изображение), но я не совсем уверен, как это можно перенести на обучение.
Думаю, это будут провалы модели * количество изображений * эпох, но здесь я не беру в расчет обратное распространение.
Я нашел несколько тестов, которые выводят количество обработанных изображений в секунду. Будет ли это полезно?