не могу установить type = "class" вgnett.rpart - PullRequest
0 голосов
/ 08 апреля 2020

Я пытаюсь использовать классификацию дерева решений для моего набора данных, который содержит 2 функции и 1 зависимую переменную, которая выглядит следующим образом: Возрастная заработная плата (Д / Н)

26 43000 0

17 57000 0

19 76000 0

27 58000 0

27 84000 0

32 150000 1

25 33000 0

Если я использую

classifier = rpart(formula = Purchased ~ ., data = training_set)

, получаю результат как

2 4 5 9
0.03296703 0.03296703 0.03296703

I нужно получить не вероятность, а наиболее вероятный результат. Но когда я использую

y_pred = predict(classifier, newdata = test_set[-3], type = 'class')

, я получаю

Ошибка в предикате.rpart (классификатор, новые данные = test_set [-3], тип = "класс"): неверный прогноз для объект "rpart"

Можете ли вы помочь мне с этим?

1 Ответ

0 голосов
/ 08 апреля 2020

Получил решение. Я должен был закодировать зависимую переменную как фактор:

dataset$Purchased = factor(dataset$Purchased, levels = c(0, 1))

После добавления этой строки все работает нормально.

...