Я пытаюсь интерпретировать результаты регрессионной проблемы, над которой я работал. Проект об оценке времени ожидания в отделении неотложной помощи. В начале я создал базовую линию, которая представляет собой медиану времени ожидания из набора данных. Эта базовая линия используется в качестве наземной базы, цель которой состоит в том, чтобы модели били базовую линию c.
Я использовал линейную регрессию и случайный лес и рассчитал норму L1, норму L2 и значения R2. Как узнать, какая из трех должна иметь максимальный вес при принятии решения, какую модель выбрать лучше? или это вообще возможно?
Результаты показали довольно низкий показатель R2, ниже 0,10, кроме того, L1, казалось, не побил базовый уровень, но L2 был лучше в каждой модели.
Я знаю, что мои данные не очень хорошие, это также было проверено путем визуализации независимых переменных и зависимых (время ожидания), но возникли проблемы при выборе модели (если она должна быть выбрана).