Question

Я хочу запустить проект pyspark ml (повышение деревьев) в кластере google gloud, чтобы сравнить точность и скорость с scikit, изучая ту же модель. Мой код готов, но я не знаю, как запустить его в кластер. Спасибо !!!

Cyac · Answer 1 · 29 апреля 2020

Первое, что вам нужно, это кластер Datapro c. После создания кластера вы можете использовать любой из параметров, перечисленных в официальной документации здесь . Но я бы предложил один из 2 вариантов ниже.

Использование gcloud dataproc jobs submit pyspark. Подробнее здесь
Отправить работу через консоль Datapro c. Подробный пример: здесь

Как запустить код pyspark ml в кластере gcp?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как запустить код pyspark ml в кластере gcp?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы