Это будет зависеть от количества элементов управления.
Если у вас много элементов управления (больше чем в 2 раза больше ядер ЦП), вложение циклов Parallel.For, скорее всего, приведет к тому, что это будет выполняться намного медленнее, поскольку вы добавляете накладные расходы, которые не могут быть решены, так как вы уже максимальный параллелизм вашей системы.
Однако, если у вас есть только один или два элемента управления, и в вашей системе 4 или 8 или более ядер, то вложение может быть полезным.
Если сомневаетесь, я бы порекомендовал попробовать и профилировать, чтобы посмотреть, поможет ли это. Просто убедитесь, что вы профилируете на разных наборах оборудования (в соответствии с вашими целями развертывания), так как одновременное профилирование очень зависит от оборудования.