Я использую инфраструктуру Unity ML Agents C# с TensorFlow для машинного обучения. Изначально я запускаю среду через приглашение Anaconda, используя ...
activate ml-agents
pushd E:\Projects\ML-Agents
mlagents-learn config/trainer_config.yaml --run-id=Main --train
... но потом, когда возобновляю обучение в приглашении, используя
mlagents-learn config/trainer_config.yaml --run-id=Main --train <b>--load</b>
... затем, к сожалению, он сбрасывает счетчик шагов на ноль (хотя нейронная сеть успешно загружается, что видно по ее постоянному опыту, который она показывает в процессе обучения). Это означает не только то, что график накопленного вознаграждения прерывается, как синяя линия на TensorBoard (это можно визуально исправить, выбрав опцию «Относительный») ...
... это также часто приводит к значительному падению диаграммы успеха, прежде чем она восстанавливается, возможно, из-за того, что тренировочный курс думает, что он находится на нулевом шаге и приспосабливается к этому.
Что можно сделать, чтобы правильно подобрать на последнем шаге? Я не удаляю файлы контрольных точек, созданные TensorFlow. Спасибо!