Я пытаюсь использовать пакет случайных лесов для классификации в R.
Перечисленные Меры Переменной Значимости:
- средний показатель важности переменной x для класса 0
- средний показатель важности переменной x для класса 1
MeanDecreaseAccuracy
MeanDecreaseGini
Теперь я знаю, что они "значат", поскольку я знаю их определения. Я хочу знать, как их использовать.
Что я действительно хочу знать, так это то, что эти значения означают только в контексте того, насколько они точны, что является хорошим значением, что является плохим значением, каковы максимумы и минимумы и т. Д.
Если переменная имеет высокий MeanDecreaseAccuracy
или MeanDecreaseGini
, значит ли это, что это важно или неважно? Также может быть полезна любая информация о необработанных результатах.
Я хочу знать все, что нужно знать об этих цифрах, которые имеют отношение к их применению.
Объяснение, использующее слова «ошибка», «суммирование» или «перестановка», было бы менее полезным, чем более простое объяснение, которое не включало бы обсуждения того, как работают случайные леса.
Как если бы я хотел, чтобы кто-то объяснил мне, как пользоваться радио, я бы не ожидал, что объяснение будет включать в себя то, как радио преобразует радиоволны в звук.