Я пытаюсь построить модель Regression
и ищу способ проверить, есть ли какая-либо корреляция между объектами и целевыми переменными?
Это всего лишь мой пример dataset
Loan_ID Gender Married Dependents Education Self_Employed ApplicantIncome\
0 LP001002 Male No 0 Graduate No 5849
1 LP001003 Male Yes 1 Graduate No 4583
2 LP001005 Male Yes 2 Graduate Yes 3000
3 LP001006 Male Yes 0 Not Graduate No 2583
4 LP001008 Male No 3+ Graduate No 6000
CoapplicantIncome LoanAmount Loan_Amount_Term Credit_History Area Loan_Status
0.0 123 360.0 1.0 Urban Y
1508.0 128.0 360.0 1.0 Rural N
0.0 66.0 360.0 1.0 Urban Y
2358.0 120.0 360.0 1.0 Urban Y
0.0 141.0 360.0 1.0 SemiUrban Y
Я пытаюсь предсказать столбец LoanAmount
на основе функций, доступных выше.
Я просто хочу увидеть, есть ли корреляция между функциями и целевой переменной.Я пробовал LinearRegression
, GradientBoostingRegressor
и с трудом получаю точность около 0.30 - 0.40%
.
Какие-либо предложения по алгоритмам, параметрам и т. Д., Которые я должен использовать для лучшего прогнозирования?