Я работаю на машине Cloudera VM с использованием только 2 CPU для одного из моих проектов и обнаружил, что когда я использовал randomsplit ([o.8, o.2], seed = 13234) для генерации обучающих и тестовых данных, я получил выход 854 210
(trainingData,testData)=assembled.randomSplit([0.8,0.2],seed=13234)
но когда я выполнил ту же команду для процессоров с 1 ВМ, результат был 859,205
Почему существует разница в разделении значений данных?