Cloudera - это просто Apache Hadoop, включающий Spark и Hive с некоторыми инструментами управления.Он в значительной степени ограничен работой HDFS.
MapR - гораздо более универсальная система.Он поддерживает программное обеспечение Apache, такое как Hadoop, Spark, Hive и Drill, но также выходит далеко за рамки этого.Поддержка Kubernetes превосходна (включая очень обычное программное обеспечение, такое как postgres или mySQL), и вы можете свободно смешивать и сочетать обычное программное обеспечение с программным обеспечением для больших данных.Вы также можете смешивать программы машинного обучения и искусственного интеллекта, не копируя данные в специализированные кластеры.
Кроме того, вы можете запускать различные системы HPC (высокопроизводительные вычисления) непосредственно в MapR без необходимости их преобразования в использование.API больших данных.