Hive в основном используется для обработки структурированных и полуструктурированных данных в Hadoop.Мы также можем выполнить анализ больших наборов данных, присутствующих в HDFS, а также в файловой системе Amazon S3, используя Hive.Для запроса данных куст также предоставляет язык запросов, известный как HiveQL, который похож на SQL.Используя Hive, можно легко запускать Ad-hoc запросы для анализа данных.Используя Hive, нам не нужно писать сложные задания Map-Reduce, нам просто нужно отправлять SQL-запросы.Hive преобразует эти запросы SQL в задания MapReduce.
Наконец, Hive SQL преобразуется в задания MapReduce, и нам не нужно отправлять задание MapReduce со всех узлов в кластере Hadoop, так же как мынеобходимо установить Hive во всех узлах кластера Hadoop