команда top для графических процессоров, использующих CUDA - PullRequest
81 голосов
/ 22 ноября 2011

Я пытаюсь отслеживать процесс, который использует cuda и MPI, есть ли какой-нибудь способ, которым я мог бы сделать это, что-то вроде команды "top", но который также контролирует GPU?

Ответы [ 13 ]

0 голосов
/ 09 февраля 2019

Вы можете использовать программу мониторинга glances с подключаемым модулем GPU :

  • с открытым исходным кодом
  • для установки:sudo apt-get install -y python-pip; sudo pip install glances[gpu]
  • для запуска: sudo glances

enter image description here

Он также контролирует процессор, дисковый ввод-вывод, дисковое пространство, сеть и еще несколько вещей:

enter image description here

0 голосов
/ 16 января 2019

вы можете использовать nvidia-smi pmon -i 0 для мониторинга каждого процесса в GPU 0. включая режим вычисления, использование sm, использование памяти, использование кодера, использование декодера.

0 голосов
/ 12 июня 2018

Существует Prometheus GPU Metrics Exporter (PGME) , который использует двоичный файл nvidai-smi.Вы можете попробовать это.Когда экспортер запущен, вы можете получить к нему доступ через http://localhost:9101/metrics.. Для двух графических процессоров пример результата выглядит следующим образом:

temperature_gpu{gpu="TITAN X (Pascal)[0]"} 41
utilization_gpu{gpu="TITAN X (Pascal)[0]"} 0
utilization_memory{gpu="TITAN X (Pascal)[0]"} 0
memory_total{gpu="TITAN X (Pascal)[0]"} 12189
memory_free{gpu="TITAN X (Pascal)[0]"} 12189
memory_used{gpu="TITAN X (Pascal)[0]"} 0
temperature_gpu{gpu="TITAN X (Pascal)[1]"} 78
utilization_gpu{gpu="TITAN X (Pascal)[1]"} 95
utilization_memory{gpu="TITAN X (Pascal)[1]"} 59
memory_total{gpu="TITAN X (Pascal)[1]"} 12189
memory_free{gpu="TITAN X (Pascal)[1]"} 1738
memory_used{gpu="TITAN X (Pascal)[1]"} 10451
...