В моей системе Tensorflow 2.2 (Python 3.8, anaconda)
. Я читал о компиляторе Tensorflow XLA и, насколько я понимаю, это альтернативный способ предварительно скомпилированных операций графического процессора, с которым поставляется Tensorflow. Даже когда я запускаю код без активного выполнения или experimental_compile=True
, я вижу XLA service 0x5644b1cec990 initialized for platform CUDA (this does not guarantee that XLA will be used)
в терминале. Также, если он каким-то образом связан, Executing op Fill in device /job:localhost/replica:0/task:0/device:GPU:0
занимает значительно много времени (~ 2 минуты), прежде чем перейти к следующей операции.