У меня очень большой набор данных, и я использую fit_generator от Keras для обучения модели Keras (бэкэнд-тензор потока).Мои данные должны быть нормализованы по всему набору данных, однако при использовании fit_generator у меня есть доступ к относительно небольшим пакетам данных, и нормализация данных в этом небольшом пакете не является показателем нормализации данных по всему набору данных.Воздействие довольно большое (я протестировал его, и точность модели значительно снизилась).
Мой вопрос таков: какова правильная практика нормализации данных по всему набору данных при использовании Keras 'fit_generator?И последнее замечание: мои данные представляют собой смесь текстовых и числовых данных, а не изображений, и, следовательно, я не могу использовать некоторые из возможностей генератора изображений, предоставляемого Keras, который может решить некоторые проблемы с данными изображений.
Я смотрел на нормализацию полного набора данных перед тренировкой (я полагаю, что это "грубая сила"), но мне интересно, есть ли более элегантный способ сделать это.