У меня есть код cuda, в котором я реализовал несколько 2D-БПФ C2C. Все они используют один и тот же план, но по какой-то причине время на двухмерных БПФ велико и, кажется, сильно различается. Одинаковый размер данных БПФ, кажется, занимает от 0,4 до 1,8 с
Это для БПФ 1920x1080. Эти времена кажутся разумными?
Во всяком случае, у меня был хороший опыт быстрой работы с пакетными БПФ CUDA. это то же самое, что взять 1D БПФ по строкам, а затем снова по столбцам матрицы, чтобы получить те же результаты, что и это 2D БПФ? У меня есть опыт БПФ, происходящий за несколько сотен секунд в больших наборах данных для 1D БПФ, поэтому я надеялся исправить некоторые из этих результатов.
Спасибо