Я не думаю, что Google Cloud ml-engine имеет какое-либо отношение к замедлению.Код, работающий на вашем компьютере, будет работать в виртуальных машинах Google Cloud таким же образом.
Многопроцессорная обработка не обязательно означает более быструю обработку.В тех случаях, когда накладные расходы на диспетчеризацию отменяют выигрыш от многократной обработки, он становится даже медленнее, чем единичная обработка.
Существует множество дискуссий о многопроцессорной обработке медленнее, чем одиночная обработка в stackoverflow.например, Многопроцессорная обработка Python занимает намного больше времени, чем однократная обработка
Я бы посоветовал вам добавить время до и после логики обработки и запустить на своем компьютере и в облачном мл-движке Google соответственно, чтобы получитьточная задержка при многопроцессорной и однократной обработке.Например,
import time
start = time.time()
#your code in multiprocessing
end = time.time()
print(end - start)
start = time.time()
#your code in single processing
end = time.time()
print(end - start)
В Google Cloud ml-engine требуется время, чтобы нарастить ВМ, что может быть задержкой, которую вы видели.Код выше покажет вам точное время ожидания.