В чем разница между h2o на нескольких узлах и h2o на hadoop? - PullRequest
0 голосов
/ 08 июня 2018

На сайте H2O написано, что

Основной код H2O написан на Java.Внутри H2O хранилище распределенного ключа / значения используется для доступа и ссылки на данные, модели, объекты и т. Д. На всех узлах и машинах.Алгоритмы реализованы поверх распределенной платформы Map / Reduce в H2O и используют многопоточную среду Java Fork / Join.

Означает ли это, что H2O не будет работать лучше, чем другие библиотеки, если он работает накластер с одним узлом?Но будет хорошо работать на кластере с несколькими узлами.Это верно?

Кроме того, в чем разница между h2o на нескольких узлах и h2o на hadoop?

1 Ответ

0 голосов
/ 08 июня 2018

см. Документацию о том, как запустить H2O на Hadoop: http://docs.h2o.ai/h2o/latest-stable/h2o-docs/welcome.html#hadoop-users

, а также эту презентацию

, которую вы можете назвать "H2O на Hadoop"как сертифицированная интеграция H2O для Hadoop.Однако вам не нужен Hadoop для запуска H2O в многоузловой среде, вы всегда можете сделать это вручную, если хотите.

...