Я замечаю это на официальном сайте pytorch: https://pytorch.org/docs/stable/nn.html
Если выполняются следующие условия:
1) cudnn включен,
2) входные данные находятся на графическом процессоре,
3) входные данные имеют тип d torch.float16,
4) используется графический процессор V100, а
5) входные данные не в формате PackedSequence.
Затем для повышения производительности можно выбрать постоянный алгоритм.
Может ли кто-нибудь объяснить это? Благодаря.