регрессия - ограниченная переменная переменной - выбор модели - PullRequest
0 голосов
/ 04 апреля 2019

Я работаю над проблемой, в которой я хочу посмотреть, является ли мера (тест) хорошим предиктором переменной результата (производительности). Производительность - это ограниченная переменная в диапазоне 0-100. Сейчас я думаю только о методологии и пока не работаю с данными.

Мне известно, что существуют различные модели и методы, которые имеют дело с ограниченными зависимыми переменными, но, насколько я понимаю, они полезны, если кто-то интересуется предсказаниями?

Меня интересует, насколько дисперсия зависимой переменной (производительность) объясняется моей мерой (тестом). Я не заинтересован в прогнозировании конкретных результатов.

Можно ли просто использовать нормальную регрессию? Нужно ли как-то учитывать ограниченную зависимую переменную?

1 Ответ

0 голосов
/ 10 апреля 2019

Вы можете масштабировать зависимую переменную в интервале [0, 1] и запустить логистическую регрессию, которая сжимает каждое входное значение в этот диапазон.

Если вы можете, вы можете использовать дробный логит модели, обычно используемые для прогнозирования непрерывных выходных данных в интервале [0, 1].

В качестве альтернативы, если вы занимаетесь машинным обучением, вы можете реализовать нейросетевой регрессор с одной выходной заметкой с функцией активации сигмоида.

...