Я пытаюсь реализовать полностью подключенную сеть для выполнения задачи классификации, в то время как мои данные обучения содержат некоторые пропущенные значения, а позиции пропусков не зафиксированы.
Например:
[x1, x2, NaN, x4, x5] [y]
[x1, x2, x3, x4, NaN] [y]
[NaN, x2, x3, NaN, x5] [y]
Я пытался реализовать некоторые методы для заполнения пропущенных значений, но в конце концов это приведет к смещению.
Для решения проблемы смещенияЯ планирую сохранить отсутствующие значения, но отбросить соответствующие узлы, чтобы отсутствующие значения отображались во входном слое, чтобы NaNs
не подавалось в сеть и не вызывало ошибок, а следующие уровни сети оставались прежними.,Интересно, существуют ли специальные методы для достижения этого в PyTorch: либо
- Удалите узел в указанной позиции слоя, либо
- Включите переменный входной размер нейронного элемента.сеть.
Однако, это всего лишь два возможных решения, которые я могу придумать, я был бы признателен, если бы вы могли поделиться со мной другими полезными способами.