Как использовать R Случайные леса для уменьшения атрибутов, не имеющих дискретных классов? - PullRequest
4 голосов
/ 07 июля 2010

Я хочу использовать Случайные леса для сокращения атрибутов. Одна из проблем, с которыми я сталкиваюсь в своих данных, заключается в том, что у меня нет дискретного класса - только непрерывного, что указывает на то, как пример отличается от «нормального». Этот атрибут класса является своего рода расстоянием от нуля до бесконечности. Есть ли способ использовать Случайный лес для таких данных?

1 Ответ

6 голосов
/ 08 июля 2010

Это не должно быть проблемой - RF просто переключится в режим регрессии.Используйте функцию randomForest из пакета randomForest.
Чтобы получить сходство объектов с аргументом proximity=TRUE, например:

randomForest(Sepal.Length~.,data=iris,proximity=TRUE)$proximity

Чтобы получить значение атрибута чистоты узла (например, индекса Джини):

randomForest(Sepal.Length~.,data=iris)$importance[,"IncNodePurity"]

Чтобы получить среднее значение MSE (например, снижение точности), значение атрибута:

randomForest(Sepal.Length~.,data=iris,importance=TRUE)$importance[,"%IncMSE"]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...