Как масштабировать входные данные для обученной модели? - PullRequest
0 голосов
/ 10 октября 2019

У меня есть обученная модель, которая использует регрессию для прогнозирования цен на жилье. Он был обучен на стандартизированном наборе данных (StandatdScaler от sklearn). Как мне масштабировать входные данные моих моделей (один пример) сейчас в другой программе на Python? Я не могу использовать StandardScaler на входе, потому что все функции будут уменьшены до 0 (MinMaxScaler тоже не работает, также пытался сохранить и загрузить скалер из обучающего скрипта - не работал). Итак, как я могу масштабировать свои входные данные, чтобы функции не были равны 0, позволяя модели правильно прогнозировать цену?

1 Ответ

1 голос
/ 10 октября 2019

То, что вы описали, является противоречием в терминах. Масштабирование относится к диапазону данных;один элемент данных не имеет «диапазона»;это точка.

То, что вы , похоже, спрашиваете, - как масштабировать входные данные, чтобы они соответствовали переводу, который вы сделали во время обучения. Ответ снова прост: вы должны использовать ту же функцию перевода, которую вы применяли во время обучения. Стандартная практика состоит в том, чтобы отменить использование модели (т.е. отменить эту функцию масштабирования);если вы этого не сделали и не указали коэффициенты этой функции, то у вас нет информации, необходимой для применения того же перевода к будущему вводу - короче говоря, ваша обученная модель не особенно полезна.

Вы могли бы попытаться восстановить коэффициенты, запустив функцию масштабирования исходного набора данных, убедившись в том, что выходная функция получена. Затем вы можете применить эту функцию к своим входным примерам.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...