Я хочу подобрать модели с различными переменными, чтобы предсказать низкий вес при рождении у детей. К различным переменным в наборе данных относятся, например, Раса , Курение , Посещение врача и т. Д. Однако, когда я оцениваю эти разные модели, включая разные переменные, Я всегда получаю одну и ту же путаницу Матрица и Точность (и все остальное). Что не так в моем коде?
Это со всеми включенными переменными (кроме одного столбца, который бесполезен).
set.seed(1)
low_birth_knn = train(Low ~ .-Last_Menstruation_Weight_bins, method = "knn", data = train_low_birth,
trControl = trainControl(method = 'cv', number = 5))
set.seed(1)
predicted_outcomes <- predict(low_birth_knn, test_low_birth)
knn_confM <- confusionMatrix(predicted_outcomes, test_low_birth$Low)
Это когда я хочу исключить Гонка например:
set.seed(1)
low_birth_knn_race = train(Low ~ (.-Last_Menstruation_Weight_bins -Race), method = "knn", data = train_low_birth,
trControl = trainControl(method = 'cv', number = 5))
set.seed(1)
predicted_outcomes_race <- predict(low_birth_knn_race, test_low_birth)
knn_confM_race <- confusionMatrix(predicted_outcomes_race, test_low_birth$Low)