Выбор переменных для интерпретации - PullRequest
0 голосов
/ 07 мая 2020

Я сравнил три метода (логистическая c регрессия, случайный лес и дерево решений с усилением) с точки зрения того, насколько хорошо они могут предсказать результат. Все модели работали плохо, со значениями RO C около 0,6 по сбалансированному набору данных. В моделях значение переменных превышало 0 для от 50 до 80 переменных. Однако я хотел бы провести небольшое, «осторожное» обсуждение того, какие предикторы были относительно важными. Теперь мой вопрос: я не знаю, где делать отсечку, и, следовательно, какие переменные включать в обсуждение важных предикторов. Насколько я читал, это довольно произвольное решение. Есть у кого-нибудь совет?

...