Как построить график из нескольких независимых переменных и одной зависимой переменной в Python [Множественная линейная регрессия] - PullRequest
0 голосов
/ 13 ноября 2018

Я новичок в машинном обучении и сталкиваюсь с ситуацией, в которой Как удалить несколько независимых переменных в множественной линейной регрессии. Шаги, которые я прошел: 1) Считать набор данных 2) разделить на X и Y 3) Кодировать категориальные данные, так как набор данных содержит столбец: prof rank, профессию и т. Д. 4) Удалить фиктивную переменную 5) Результаты регрессии OLS.

У меня было 7 независимых переменных, после OLS у меня есть 6 независимых переменных. Удаляется с помощью P> 0,05, поскольку значение P превышает 0,05 уровня значимости.

Можете ли вы предложить какие шаги для построения графика с удалением всех ненужных независимых переменных, как прикреплено на изображении ?. Как получить только ОДНА независимая переменная из всех этих переменных.

Как проверить мультиколлинеарность с помощью python? Что такое VIF и как его использовать для обнаружения мультиколлинеарности

Заранее спасибо. Извините за ошибки грамматики, если таковые имеются.

Сводка результатов регрессии OLS

1 Ответ

0 голосов
/ 13 ноября 2018

Довольно сложно визуализировать многомерные линейные отношения. Этот пост поделился некоторыми общими способами визуализации.

Мультиколлинеарность - большая проблема для регрессии, и это приводит к странным коэффициентам в ваших бета-версиях. VIF является одним из инструментов, используемых для обнаружения этого.Как правило, чем ближе VIF к 1, тем лучше.

Если у вас мультиколлинеарность, вы можете перейти к одному из следующих вариантов:

...