Должна быть связь между встроенной отладкой (nvcc -g -G для отладки с помощью cuda-gdb) и потреблением ресурсов GPU?
Я использую Ubuntu 16.04, инструментарий 8.0 на GPU GTX 1080 и отлаживаю некоторый код глубокого обучения в Tensorflow 1.4.0 с помощью внутреннего кода C ++ для GPU. Как только я переключаюсь на сборку кода с отладочной информацией, он разрывается с
cudaCheckError() too many resources requested for launch
отметил, что с выпуском релиза у него нет этой проблемы, хотя мой код довольно близок к пределу GPU. Как мне удалось собрать и отладить в этом случае?