В модели seq2seq используется механизм внимания. (Данные - «Диалоги фильмов Корнелла». Я хочу использовать эту модель для чат-бота.
Я обучил его около 200 эпох. Как узнать, что моя модель достаточно тренирована?
Ранее я использовал скорость обучения 0,001. Тогда я использовал спад скорости обучения. Но через некоторое время скорость обучения стала настолько маленькой, что модель ничего не изучала. Итак, я вручную установил его на 0,0005. Есть предложения по обучению?