Как разделить данные с помощью перекрестной проверки в Spark для SVM и DT - PullRequest
0 голосов
/ 01 января 2019

Я использую Spark MLlib для своего проекта.Я использовал SVM, дерево решений и случайный лес.Я разделил набор данных на обучение и тестирование (60% обучение, 40% тестирование) и получил свои результаты.

Я хочу повторить свою работу, но делю данные с помощью перекрестной проверки вместо процентного разделения для SVM, DTи RF.

Как я могу это сделать на Spark?Я нашел несколько кодов для разделения с использованием логистической регрессии и конвейера, которые не могут работать для SVM.

Мне нужно разделить данные в 10 раз, а затем применить SVM.

также я хочупечатать Точность для каждого сгиба.

...