Пакет MLR R - изменить формулу для GLM - PullRequest
0 голосов
/ 16 февраля 2019

Я новичок в пакете млр.Я пытаюсь изменить формулу для моего glm, который мне подходит, используя пакет mlr.

Я подгоняю свою логистическую регрессию, используя приведенный ниже код.

#logistic regression
logistic.learner <- makeLearner("classif.logreg",predict.type =     "response")

#cross validation (cv) accuracy
cv.logistic <- crossval(learner = logistic.learner,
                    task = trainTask, iters = 3,stratify = TRUE,
                    measures = acc, show.info = F)

#cross validation accuracy
cv.logistic$aggr
cv.logistic$measures.test


#train model
fmodel <- train(logistic.learner,trainTask)
getLearnerModel(fmodel)

Ниже приводится мой вывод.Очевидно, что не все функции важны, и я хочу использовать только некоторые из них, настроив формулу glm.Но я не знаю, как изменить этот параметр, используя пакет mlr.

> summary(fmodel$learner.model)

    Call:
      stats::glm(formula = f, family = "binomial", data = getTaskData(.task, 
                                                                      .subset), weights = .weights, model = FALSE)

    Deviance Residuals: 
      Min       1Q   Median       3Q      Max  
    -2.3484  -0.3611   0.5153   0.7130   2.5401  

    Coefficients:
      Estimate Std. Error z value Pr(>|z|)    
    (Intercept)             -3.024e+00  1.137e+00  -2.660 0.007810 ** 
    GenderMale               2.469e-03  3.027e-01   0.008 0.993492    
    MarriedYes               5.911e-01  2.558e-01   2.311 0.020851 *  
    Dependents1             -4.398e-01  3.005e-01  -1.463 0.143402    
    Dependents2              3.120e-01  3.517e-01   0.887 0.374985    
    Dependents3             -8.299e-03  4.246e-01  -0.020 0.984407    
    EducationNot Graduate   -4.421e-01  2.663e-01  -1.660 0.096877 .  
    Self_EmployedYes        -3.111e-02  3.250e-01  -0.096 0.923736    
    ApplicantIncome          3.549e-05  4.886e-05   0.726 0.467542    
    CoapplicantIncome       -3.083e-05  6.131e-05  -0.503 0.615105    
    LoanAmount              -2.748e-03  2.756e-03  -0.997 0.318682    
    Loan_Amount_Term        -2.254e-03  2.281e-03  -0.988 0.322916    
    Credit_History1          4.066e+00  4.373e-01   9.296  < 2e-16 ***
    Property_AreaSemiurban   9.163e-01  2.725e-01   3.362 0.000774 ***
    Property_AreaUrban       2.191e-01  2.642e-01   0.829 0.406880    
    Gender.dummy1           -2.910e-01  7.389e-01  -0.394 0.693675    
    Dependents.dummy1        2.670e-01  8.188e-01   0.326 0.744307    
    Self_Employed.dummy1    -1.584e-01  4.418e-01  -0.358 0.719984    
    LoanAmount.dummy0        9.821e-01  5.160e-01   1.903 0.056996 .  
    Loan_Amount_Term.dummy1  9.370e-01  8.666e-01   1.081 0.279623    
    Credit_History.dummy1   -1.271e-01  3.675e-01  -0.346 0.729438    
    Income_by_loan          -2.112e-03  5.259e-03  -0.402 0.687931    
    Loan_amount_by_term     -1.978e-01  2.570e-01  -0.770 0.441523    
    ---
      Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    (Dispersion parameter for binomial family taken to be 1)

    Null deviance: 762.89  on 613  degrees of freedom
    Residual deviance: 551.83  on 591  degrees of freedom
    AIC: 597.83

    Number of Fisher Scoring iterations: 5

Буду признателен за любую помощь

Спасибо!

1 Ответ

0 голосов
/ 17 февраля 2019

mlr не поддерживает это - формула всегда имеет форму target~..Тем не менее, это не звучит так, как будто вы действительно хотите это сделать - чтобы выяснить, какие функции и взаимодействия важны, вам нужно передать все это модели.

Конечно, вы можетеобъединить модель с подходом выбора признаков (например, , оборачивая учащегося в выбор функции ), чтобы уменьшить количество функций, необходимых для окончательной модели.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...