Точная матрица одинаковой точности и путаницы для разных моделей - PullRequest
0 голосов
/ 27 мая 2019

Я хочу подобрать модели с различными переменными, чтобы предсказать низкий вес при рождении у детей. К различным переменным в наборе данных относятся, например, Раса , Курение , Посещение врача и т. Д. Однако, когда я оцениваю эти разные модели, включая разные переменные, Я всегда получаю одну и ту же путаницу Матрица и Точность (и все остальное). Что не так в моем коде?

Это со всеми включенными переменными (кроме одного столбца, который бесполезен).

set.seed(1)

low_birth_knn = train(Low ~ .-Last_Menstruation_Weight_bins, method = "knn", data = train_low_birth,
                   trControl = trainControl(method = 'cv', number = 5))

set.seed(1)

predicted_outcomes <- predict(low_birth_knn, test_low_birth)

knn_confM <- confusionMatrix(predicted_outcomes, test_low_birth$Low)

Это когда я хочу исключить Гонка например:

set.seed(1)

low_birth_knn_race = train(Low ~ (.-Last_Menstruation_Weight_bins -Race), method = "knn", data = train_low_birth,
                      trControl = trainControl(method = 'cv', number = 5)) 

set.seed(1)

predicted_outcomes_race <- predict(low_birth_knn_race, test_low_birth)

knn_confM_race <- confusionMatrix(predicted_outcomes_race, test_low_birth$Low)
...