Короче говоря: все проблемы, которые вы упомянули, и даже больше.
- Масштабирование необходимо, обычно до 0 означает и дисперсия 1 .В противном случае вы быстро насытите скрытые единицы, их градиенты будут близки к нулю, и (почти) обучение не будет возможным.
- Смещение является обязательным для такого ANN.Это как смещение для подгонки линейной функции.Если вы уроните его, получить хорошую форму будет очень сложно.
- Похоже, вы проверяете точность своих тренировочных данных.
- У вас очень мало тренировочных образцов.
- Сигмоиддоказано, что плохой выбор.Используйте ReLU и проверьте, например, здесь для объяснения.
Кроме того, я бы рекомендовал потратить некоторое время на изучение Python, прежде чем углубляться в это.Для начала, избегайте использования global
, это может привести к непредвиденному поведению, если вы не будете осторожны.