Вы ответили на свой вопрос, когда сказали, что вам необходимо изменить скорость обучения по мере обучения в сети. Есть много разных способов сделать это.
Самый простой способ - уменьшить скорость обучения линейно с количеством итераций. Каждые 25 (или любое другое произвольное число) вычитайте часть ставки, пока она не достигнет хорошего минимума.
Вы также можете сделать это нелинейно с количеством итераций. Например, умножьте скорость обучения на 0,99 каждую итерацию, снова, пока она не достигнет хорошего минимума.
Или вы можете стать более хитрым. Используйте результаты сети, чтобы определить следующую скорость обучения сети. Чем лучше он работает по метрике фитнеса, тем меньше скорость обучения. Таким образом, он будет быстро сходиться столько, сколько нужно, а затем медленно. Это, вероятно, лучший способ, но он более затратный, чем простой подход с числом итераций.