Я бы сказал, что Hive MetaStore полезен больше, чем сам HiveServer2 в качестве интерфейса запроса.
MetaStore - это то, что Presto и Spark используют для получения данных гораздо быстрее, чем MapReduce, но, возможно, не так быстро, как хорошо оптимизированный запрос Tez, и в Hive v2.x +, например, вносятся улучшения, например, с LLAP.
В конце концов, Hive действительно полезен только в том случае, если конвейеры приема фактически хранят данные в столбчатых форматах ORC или Parquet. Отсюда и разумный механизм запросов может довольно быстро сканировать эти данные, и Hive просто считается де-факто реализацией этого шаблона доступа, тогда как Impala или Presto часто более часто используются для доступа ad hoc.
При этом Hive (и другие SQL в Hadoop) не используются для "сборки", он используется для "анализа"
И я не знаю, что вы подразумеваете под «стандартным» - Hive поддерживает любое соединение ODBC / JDBC, так что вы не заходите в CLI для полного доступа, а HUE или Zeppelin делают действительно хорошие блокноты для анализа SQL по улей.