В настоящее время я использую алгоритм RandomForest с PySpark. Я смотрю на искровой пользовательский интерфейс, чтобы отслеживать прогресс в обучении модели, но я не знаю, сколько времени это займет. Кажется, что приложение повторяет одно и то же задание несколько раз (collectAsMap at RandomForest. scala: 563), есть ли способ подсчитать, сколько оно будет делать? Сначала я думал, что максимальное количество заданий такое же, как у maxDepth, но сейчас у меня более 100 заданий, а maxDepth равно 20.