Недавно успешно сконфигурировал мой GPU с Tensorflow, чтобы минимизировать время обучения 16-итеративных нейронных моделей из 150 эпох каждый из 12 часов на CPU. Я еще не тестировал производительность графического процессора во всех 16 итерациях, хотя полагаю, что это займет гораздо меньше времени, чем 12 часов (мое предположение).
Прошлой ночью я провел обучение модели для 1 итерации из 150 эпох. и модель заняла приблизительно 30 минут, чтобы обучиться. Тем не менее, я заметил из показателей жизненного цикла моей системы, что графический процессор использовался только для 10% своей емкости, в отличие от 90% процессорной мощности, используемой для обучения модели в течение 150 эпох. Несмотря на то, что мой графический процессор правильно настроен на CUDA и CuDNN, он использует только 10% своей емкости для Tensorflow. Как я могу сконфигурировать Tensorflow для использования 100% мощности моего GPU и освободить всю емкость CPU?
Конфигурация относительно GPU
from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())
stdout 1:
[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 10937863864393548495
, name: "/device:GPU:0"
device_type: "GPU"
memory_limit: 4849834393
locality {
bus_id: 1
links {
}
}
incarnation: 7632083706462665444
physical_device_desc: "device: 0, name: GeForce GTX 1660 Ti, pci bus id: 0000:01:00.0, compute capability: 7.5"
]
import tensorflow as tf
print("Version: ", tf.__version__)
print("Eager mode: ", tf.executing_eagerly())
print("Hub version: ", hub.__version__)
print("GPU is", "available" if tf.config.list_physical_devices('GPU') else "NOT AVAILABLE")
print("Num GPUs Available: ", len(tf.config.experimental.list_physical_devices('GPU')))
стандартный вывод 2:
TensorFlow version: 2.1.0
Version: 2.1.0
Eager mode: True
Hub version: 0.7.0
GPU is available
Num GPUs Available: 1
from platform import python_version
print("Python version installed: ", python_version())
стандартный вывод 3:
Python version installed: 3.7.4
!nvcc --version
стандартный вывод 4:
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Sun_Jul_28_19:12:52_Pacific_Daylight_Time_2019
Cuda compilation tools, release 10.1, V10.1.243
CuDNN версия: cudnn-10.1- windows10 -x64-v7.6.5.32