Мы запускаем алгоритм на устройствах Android, который требует многократных вычислений FFT в секунду, мы хотели бы уменьшить потребление батареи, используя более эффективную версию FFT.
На данный момент мы используем версию Eigen, которая, как я считаю, использует kissFFT в качестве бэкэнда. Я также попытался скомпилировать библиотеки ARM HPC для Android без особого успеха (хотя при тестировании на сервере они были в 3-4 раза быстрее, чем Eigen). Я также исследую реализацию FFTW, но похоже, что он поддерживает только 32-битные неоновые операции, хотя он должен быть оптимизирован для Aarch64.
Я понимаю, что arm-v8a добавил операции двойной точности в набор команд NEON, поэтому это должно быть возможно, но есть ли какая-нибудь реализация, которая это делает?
Я не прав и просто невозможно сделать FFT на двойных числах в arm-v8a?