R - Построение случайного леса - PullRequest
0 голосов
/ 21 апреля 2020

Я работаю над анализом качества вина на основе ряда характеристик, присутствующих в вине. Я сгруппировал вино по двум категориям: 1 - «Высокое качество», а 0 - «Среднее качество».

После выполнения выбора модели, чтобы определить, какая модель привела к наименьшему общему количеству ошибок, я хочу использовать случайные леса для дальнейшего анализа. После определения оптимального значения mtry (какое количество переменных, рассматриваемых при каждом разделении, дает наименьшую общую частоту ошибок), я запускаю случайный лес для своих данных, используя это значение.

Результаты моего случайного леса выглядят как Я ожидаю, и мне было любопытно, есть ли хороший способ визуализировать образец дерева из леса? Или любые другие визуализации, которые помогут мне объяснить результаты (я уже создаю графики важности для каждой из переменных).

Есть мысли?

Результаты определения наиболее оптимального значения mtry : enter image description here

Текущий код:

set.seed(8, sample.kind = "Rounding")
wine.bag=randomForest(quality01 ~ alcohol + volatile_acidity + sulphates + residual_sugar + 
    chlorides + free_sulfur_dioxide + fixed_acidity + pH + density + 
    citric_acid,data=wine,mtry=3,importance=T)
wine.bag

plot(wine.bag)

importance(wine.bag)
varImpPlot(wine.bag)
test=wine[,c(-12,-13,-14)]
rest=cor(test)
corrplot(rest, type = "upper", order = "hclust", 
         tl.col = "black", tl.srt = 45)
...