Question

Я пытаюсь интерпретировать результаты регрессионной проблемы, над которой я работал. Проект об оценке времени ожидания в отделении неотложной помощи. В начале я создал базовую линию, которая представляет собой медиану времени ожидания из набора данных. Эта базовая линия используется в качестве наземной базы, цель которой состоит в том, чтобы модели били базовую линию c.

Я использовал линейную регрессию и случайный лес и рассчитал норму L1, норму L2 и значения R2. Как узнать, какая из трех должна иметь максимальный вес при принятии решения, какую модель выбрать лучше? или это вообще возможно?

Результаты показали довольно низкий показатель R2, ниже 0,10, кроме того, L1, казалось, не побил базовый уровень, но L2 был лучше в каждой модели.

Я знаю, что мои данные не очень хорошие, это также было проверено путем визуализации независимых переменных и зависимых (время ожидания), но возникли проблемы при выборе модели (если она должна быть выбрана).

user2974951 · Answer 1 · 17 января 2019

Это не реальные показатели производительности. Используйте стандартные показатели производительности, такие как точность или MSE, для классификации и регрессии соответственно. Вы можете оценить их, используя перекрестную проверку или отдельный набор тестов.

Проблема регрессии, как интерпретировать результат из базовой линии, при использовании L1, L2 и R2

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Проблема регрессии, как интерпретировать результат из базовой линии, при использовании L1, L2 и R2

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы