cross_val_score, разные cv возвращают разные оценки для одного и того же метода - PullRequest
0 голосов
/ 20 января 2019

Мне трудно понять мой результат. Я использую ту же модель, тот же метод и те же настройки, только с разными k, где cv = k. Пожалуйста, смотрите изображение ниже.

  • Когда k = 4, результат выглядит хорошо для clf_apgd_l1 модели,
  • Когда k = 3, не хорошо. есть одна часть, что cross_val_score является довольно низким, то есть 0,03377111
  • Когда k = 5, тоже не хорошо, одна часть cross_val_score слишком мала, i, e, 0.03426791

Для тех же данных я протестировал другой метод, логистическая регрессия, и возвращенные cvs выглядят хорошо, для k = 3, все cross_val_score выше 0,5.

Почему у меня такие разные значения для моей модели clf_apgd_l1 (модель пропорциональных шансов, штраф l1, ускоренный проксимальный градиентный спуск (APGD или FISTA)) для разных cv с? Код выглядит следующим образом:

from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import cross_val_score
from sklearn.base import BaseEstimator, ClassifierMixin

screenshot

...