Нет такого кода, потому что количество FLOP зависит от аппаратных и программных реализаций. Конечно, вы можете получить типичное количество, расширяя послойные операции для каждого параметра и веса. и делать разумные предположения реализации для каждой функции активации.
Входные размеры будут пропорционально влиять на вычисления для первого слоя.
Я не уверен, что вы собираетесь использовать для "обобщенного кода на Python"; Вы планируете использовать форму модели Keras в качестве входных данных? Это возможно, но вам нужно написать модули, которые будут извлекать характеристики ядра и логику соединения из представления Keras.
Количество операций будет варьироваться от одной реализации к другой. Аппаратные архитектуры теперь напрямую поддерживают параллельные операции и ярлыки для разреженных матриц. Некоторые из них имеют дополнительную функциональность для настройки представлений с плавающей точкой для большей скорости обучения. Программные платформы включают контроль и анализ потока данных для оптимизации функционального потока. Любое из них изменит вычисление FLOP.