Почему сложная арифметика с половинной точностью не поддерживается в Python и CUDA? - PullRequest
3 голосов
/ 26 июня 2019

NumPY имеет complex64 , что соответствует двум типам float32.

Но он также имеет float16, но не сложный32.

Как получилось? У меня есть расчет обработки сигналов с использованием БПФ, где я думаю, что я буду в порядке с complex32, но я не вижу, как туда добраться. В частности я надеялся на ускорение на GPU NVidia с cupy .

Однако, похоже, что float16 медленнее на графическом процессоре, а не быстрее.

Почему половина точности не поддерживается и / или игнорируется?

Также связано то, почему у нас нет сложных целых чисел , поскольку это также может предоставить возможность для ускорения .

...