Сохраненные данные X, y в оценщике scikit-learn - PullRequest
1 голос
/ 01 мая 2020

Мне кажется, что данные, когда они подходят, не сохраняются на оценщиках. Я делю класс подкласса BaseEstimator и мне интересно следующее:

  • Существует ли причина, по которой базовые данные не копируются / сохраняются, когда оценщик вызывает .fit()?

  • Если я делаю скопировать данные в свойство self.X / self.y на моем подклассе, это то, о чем я позже пожалею?

1 Ответ

0 голосов
/ 01 мая 2020

Из документации sklearn ,

Обратите внимание, что модель подбирается с использованием X и y, но объект не имеет ссылки на X и y. Однако есть некоторые исключения из этого, как в случае предварительно вычисленных ядер, где эти данные должны храниться для использования с помощью метода прогнозирования.

Причина, по которой данные не сохраняются, заключается в том, что,
в общем случае, после того, как оценщик установлен, сами данные больше не будут использоваться.

Будете ли вы позже сожалеть о том, что скопировали данные в свойства, зависит от нескольких факторов: от требований к приложению, варианта использования, размера данных и других.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...