Хотя верно, что разные функции активации имеют разные достоинства (в основном, либо для биологической достоверности, либо для уникальной конструкции сети, такой как сети с радиальными базисными функциями ), в целом вы можете использовать любую функцию непрерывного сдавливания и ожидайте, что сможете приблизиться к большинству функций, встречающихся в реальных тренировочных данных.
Двумя наиболее популярными вариантами являются гиперболический тангенс и логистическая функция, поскольку они оба имеют легко вычисляемые производные и интересное поведение вокруг оси.
Если ни то, ни другое не позволяет вам точно аппроксимировать вашу функцию, мой первый ответ не будет состоять в изменении функций активации. Вместо этого вам следует сначала изучить свой тренировочный набор и сетевые параметры обучения (скорость обучения, количество единиц в каждом пуле, снижение веса, импульс и т. Д.).
Если вы все еще застряли, сделайте шаг назад и убедитесь, что вы используете правильную архитектуру (прямая передача по сравнению с простой повторяющейся по сравнению с полной повторной) и алгоритм обучения (обратное распространение по сравнению с обратным пропуском во времени против контрастного иврита против эволюционные / глобальные методы).
Примечание с одной стороны: убедитесь, что вы никогда не используете функцию линейной активации (за исключением выходных слоев или сумасшедших простых задач), поскольку они имеют очень хорошо документированное ограничение с, а именно потребность в линейной отделимости.