Как говорили люди, «единственная разница в том, что вы находитесь в куберне / контейнере».В действительности это означает пару огромных вещей с точки зрения фактической работы:
- Диаграмма руля, связанная выше, - игрушка.
- Он создает ванильный hadoop (т.е. не HDP или CDH)
- Он не делает НА-наменоды HA
- Он не делает Kerberos
- Вы должны управлять своими собственными томами
- Если вы работаете в публичном облаке, это не такая уж большая проблема, поскольку вы можете динамически получать хранилище
Так что, если вы просто не хотите сверхлегкого развертывания hdfs, или вы не хотите / хотите создать собственное развертывание более сложного развертывания k8s hadoop, или вы готовы платить за сторонний стек kubernetes с помощью hadoopподдержка (например, robin.io), я бы сказал, что в целом на этом этапе не стоит работать на k8s.
Обратите внимание, что если / когда поставщики Hadoop сделают свой собственный оператор , это может измениться.