Коэффициент корреляции над определением корреляции в линейной регрессии - PullRequest
0 голосов
/ 29 мая 2020

Я новичок в машинном обучении и использую набор данных о ценах на жилье с kaggle.com для решения проблемы регрессии. Я хочу знать разницу между коэффициентом корреляции и определением корреляции и почему люди используют одно вместо другого. например, я могу увидеть отношение между YearBuild и SalePrice следующим образом

enter image description here

теперь, в чем польза определения коэффициента, почему он используется

если R = Coeffiecient Corellation, то определение коэффициента = R x R

  1. - это процентное представление коэффициента Corellation?
  2. это отношение отдельного признака к остальному признаку?

1 Ответ

1 голос
/ 29 мая 2020

Коэффициент R squared говорит вам, какую часть дисперсии объясняет регрессионная модель. Например, если оно равно 0.01, это означает, что вы объяснили один процент дисперсии. Это полезно знать по понятным причинам. В отличие от коэффициента корреляции, R squared всегда положительный, поэтому просто говорит вам, что существует (или нет) линейная зависимость, но не о том, какова ее форма.

...