Я сделал программу CUDA для двумерной свертки и теперь хочу сравнить ее с какой-то реализацией не-CUDA для измерения ускорения.
Я мог бы сравнить с моей собственной реализацией в простом C, используя классическое множественное числоциклический подход или matlab conv2, но это не похоже на законное / честное сравнение, поскольку они не являются самыми быстрыми реализациями.
Кроме того, я думал о том, чтобы попробовать OpenCV, и я безуспешно искал SIMD-оптимизированную версию.Любой совет, я должен пойти с OpenCV?
ПРИМЕЧАНИЕ: я читал другие вопросы, включая этот , но ответ в основном такой же, как мой простой код C или обсуждениеразличные методы доступны.