Я пишу пользовательскую операцию, используя функции cublas cublasCgetrfBatched
и cublasCgetriBatched
, функции используют дескриптор cublas в качестве входного параметра, однако cublasCreate(&handle);
стоит почти 100 мс.Я думаю, что TF уже интегрировал модуль CUBLAS, cublasCreate(&handle)
должно быть вызвано в процессе инициализации, тогда как получить дескриптор?Пример может быть лучшим!