Масштабируемость перспективных функций в машинном обучении? - PullRequest
0 голосов
/ 01 июня 2018

У меня есть вопрос о том, как работает масштабирование объектов после обучения модели.

Допустим, модель нейронной сети предсказывает высоту дерева, обучаясь при температуре наружного воздуха.

Самый низкий показатель снаружитемпература в моих тренировочных данных 60F, а максимальная 100F.Я измеряю температуру от 0 до 1 и тренирую модель.Я сохраняю модель для будущих прогнозов.Через два месяца я хочу предсказать некоторые новые данные.Но на этот раз минимальная и максимальная температуры в моих данных испытаний составляют -20F и 50F соответственно.

Как с этим справляется обученная модель?Диапазон, на который я наложил масштабирование в обучающем наборе для генерирования моей обученной модели, не соответствует диапазону тестовых данных.

Что помешает мне жестко кодировать диапазон для масштабирования, чтобы я знал, что данные всегда будутбыть в пределах, скажем, от -50F до 130F?Проблема, которую я вижу здесь, заключается в том, что у меня есть модель с множеством функций.Если я навязываю разные жесткие масштабы для каждой функции, использование масштабирования по сути бессмысленно, не так ли?

1 Ответ

0 голосов
/ 01 июня 2018

Различные весы не будут работать.Ваша модель обучается по одной шкале, она учится по одной шкале. Если вы измените шкалу, ваша модель все равно будет думать, что это та же шкала, и делать очень смещенные прогнозы.

Обучение снова перезапишет то, что выучили раньше.

Итак, да, жестко закодируйте масштабирование (предпочтительно непосредственно в ваших данных, а не внутри модели).

И для качественного результата тренируйтесь со всеми данными, которые вы можете собрать.

...