Как реализовать интерфейс оценщика sklearn для использования в конвейере GridSearchCV? - PullRequest
0 голосов
/ 14 февраля 2020

Итак, у меня есть собственная реализация классификатора Perceptron, и я хотел бы настроить его гиперпараметры, используя GridSearchCV от sklearn. Я пытался написать оболочку для модели, которая реализует Estimator (прочитайте https://scikit-learn.org/stable/developers/develop.html), но когда я запускаю GridSearchCV(wrapper, params).fit(X,y), я получаю следующую ошибку:

FitFailedWarning: Estimator fit failed. The score on this train-test partition for these parameters will be set to nan. Details:
AttributeError: 'NoneType' object has no attribute 'fit'

  FitFailedWarning)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\ProgramData\Anaconda3\lib\site-packages\sklearn\model_selection\_search.py", line 738, in fit
    **self.best_params_))
  File "C:\ProgramData\Anaconda3\lib\site-packages\sklearn\base.py", line 67, in clone
    % (repr(estimator), type(estimator)))
TypeError: Cannot clone object 'None' (type <class 'NoneType'>): it does not seem to be a scikit-learn estimator as it does not implement a 'get_params' methods.

Эта ошибка идентична Как написать собственный оценщик в sklearn и использовать перекрестную проверку на нем? но я уже делал все, что было предложено в комментарии с самым высоким рейтингом.

Я Положительно, что модель верна. Вот код для обёртки вокруг модели:

from models import Perceptron, Softmax, SVM
from sklearn.model_selection import GridSearchCV

class Estimator():
    def __init__(self, alpha=0.5, epochs=100):
        self.alpha = alpha
        self.epochs = epochs
        self.model = Perceptron()

    def fit(self, X, y, **kwargs):
        self.alpha = kwargs['alpha']
        self.epochs = kwargs['epochs']
        self.model.alpha = kwargs['alpha']
        self.model.epochs = kwargs['epochs']
        self.model.train(X, y)

    def predict(self, X):
        return self.model.predict(X)

    def score(self, data, targets):
        return self.model.get_acc(self.predict(data), targets)

    def set_params(self, alpha, epochs):
        self.alpha = alpha
        self.epochs = epochs
        self.model.alpha = alpha
        self.model.epochs = epochs

    def get_params(self, deep=False):
        return {'alpha':self.alpha, 'epochs':self.epochs}

1 Ответ

0 голосов
/ 16 февраля 2020

Как объяснено в этом разделе документации , вы должны извлечь класс из BaseEstimator class Estimator(BaseEstimator):, чтобы избежать шаблонов и следовать структуре предсказания соответствия. Как сказал @Shihab в комментариях, в вашей функции подгонки отсутствует строка кода return self.

Кроме того, в get_params () я не знаю, намеренно ли вы это делаете, но параметр deep в документации также рекомендуется указывать его как deep=True по умолчанию. Пожалуйста, проверьте это.

...