Я хочу проанализировать и решить несколько вопросов из очень известного проекта под названием «Анализ качества красного вина», который можно бесплатно получить по следующей ссылке: https://www.kaggle.com/piyushgoyal443/red-wine-analysis/data
Проблема состоит в том, чтобы найти 2 самых важных предикторакачества красного вина.
Я приступил к использованию функции ols_all_step_possible () в пакете olsrr в R. В результирующей части он дает кадр данных для каждой комбинации предикторов с моделью и ее rsquare, Adj.rsquare, AIC, fpe, .......
Я обнаружил, что алкоголь и изменчивая кислотность являются двумя лучшими предикторами, основанными на высоком Adj.rsquare и низком (AIC, fpe) от результата:
Результаты
Изображение файла результата
У меня вопрос, достаточно ли взглянуть на rsquare и AIC модели, чтобы сказать, что эти переменные (включеныв модели и есть ли р-значения значимы) важны ли предикторы?Или мы должны разделить его на наборы тестов поездов и посмотреть тест MAPE, а затем решить, является ли он важным предиктором или нет?