Почему разделение данных обучения и теста отличается в vm с 1CPU и 2CPU? - PullRequest
0 голосов
/ 07 сентября 2018

Я работаю на машине Cloudera VM с использованием только 2 CPU для одного из моих проектов и обнаружил, что когда я использовал randomsplit ([o.8, o.2], seed = 13234) для генерации обучающих и тестовых данных, я получил выход 854 210

(trainingData,testData)=assembled.randomSplit([0.8,0.2],seed=13234)

но когда я выполнил ту же команду для процессоров с 1 ВМ, результат был 859,205

Почему существует разница в разделении значений данных?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...