Это особый случай для моделей с глубоким обучением и не относится к любым другим моделям, созданным в процессе AutoML. По соображениям эффективности (а поскольку H2O предназначен для очень больших наборов данных), метрики обучения в моделях глубокого обучения рассчитываются на основе подмножества исходной рамки обучения.
В алгоритме глубокого обучения H2O есть параметр *1004*, называемый score_training_samples
, который по умолчанию равен 10000 строк (и, поскольку мы выполняем приблизительную выборку, также по соображениям эффективности, имеет смысл, что фактическаяразмер подмножества составляет 9 993).
Это должно быть хорошим приближением к ошибке обучения. Единственный способ изменить это в Flow - это обучить модель глубокого обучения вручную (вне процесса AutoML).