Я обучил textum в 4-gpus и 1-gpu, я обнаружил, что 4-gpus медленнее, чем один GPU, и все они имеют низкое использование, любой может помочь мне решить эту проблему?