В настоящее время я пытаюсь использовать сеть автоматического кодирования для уменьшения размерности.
(то есть использование активации узкого места в качестве функции сжатия)
Я заметил, что во многих исследованиях, в которых для этой задачи использовался автоэнкодер, используется линейный слой узких мест.
Интуиция, на мой взгляд, имеет смысл, поскольку использование функции нелинейной активации может снизить способность узкого места представлять основную информацию, содержащуюся в исходной функции.
(например, ReLU игнорирует отрицательные значения, а сигмовидная оболочка подавляет значения, слишком высокие или слишком низкие)
Однако верно ли это? И необходимо ли использовать линейный слой узких мест для автоэнкодера?
Если возможно использовать нелинейный слой начальной загрузки, какая функция активации будет лучшим выбором?
Спасибо.