Временная выборка кадров потока воды H2O - PullRequest
1 голос
/ 05 ноября 2019

У меня есть большая рамка и я использую автоматику потока воды с глубоким обучением. Тем не менее, показатели обучения рассчитываются по «временному выборочному кадру». Я не мог найти информацию об этом. Я не уверен, был ли запущен automl на полном кадре или только на этом временном кадре. Может кто-нибудь помочь разобраться или дать указатель? Кстати, я не считаю эту функцию удобной. screenshot

1 Ответ

1 голос
/ 06 ноября 2019

Это особый случай для моделей с глубоким обучением и не относится к любым другим моделям, созданным в процессе AutoML. По соображениям эффективности (а поскольку H2O предназначен для очень больших наборов данных), метрики обучения в моделях глубокого обучения рассчитываются на основе подмножества исходной рамки обучения.

В алгоритме глубокого обучения H2O есть параметр *1004*, называемый score_training_samples, который по умолчанию равен 10000 строк (и, поскольку мы выполняем приблизительную выборку, также по соображениям эффективности, имеет смысл, что фактическаяразмер подмножества составляет 9 993).

Это должно быть хорошим приближением к ошибке обучения. Единственный способ изменить это в Flow - это обучить модель глубокого обучения вручную (вне процесса AutoML).

...