Случайный лес дает мне 0% точности - PullRequest
0 голосов
/ 01 апреля 2019

Я попытался создать случайный лес с помощью youtube. Я действительно новичок в концепции ML, поэтому я попытался использовать все по умолчанию.

Сначала я дал своему тренировочному набору 2 фактора, которые сами по себе немного отличаются.

Основная проблема заключается в том, что я получаю 0% точности , как будто все предсказывается как 0 , потому что это главное значение (70% от 0 30% от 1)

Код здесь:

pedes.10 <- cas.10[which(cas.10$Casualty_Type == "0"),]

pedes.10$Age_Band_of_Casualty <- as.factor(pedes.10$Age_Band_of_Casualty)

# to make Injury only on 1 and 2 value
for (i in 1:nrow(pedes.10)) {
  x <- ifelse(pedes.10$Casualty_Severity != "3", 1, 0)
  pedes.10$Injury <- x
}

#Starting the random forest
rf.train.1 <- pedes.10[, c("Age_Band_of_Casualty", "Sex_of_Casualty")]
rf.label <- as.factor(pedes.10$Injury)

set.seed(9299)

rf.1 <- randomForest(x = rf.train.1, y = rf.label, importance = FALSE, ntree = 3000)
rf.1
varImpPlot(rf.1)

Я получаю 0% точности в первом случае и 100% в другом. Я понимаю, что сделал что-то не так, но не знаю, что делать ...

Набор данных здесь: (Потери 2010) -> https://data.gov.uk/dataset/cb7ae6f0-4be6-4935-9277-47e5ce24a11f/road-safety-data

Спасибо за помощь.

Пусть изображение здесь

пусть изображение здесь here

...