В основном вам нужно запустить скрипт HiveQL (.hql) из оболочки.
Создать скрипт .hql
с вашим запросом на получение данных только за последние 100 дней.
example.hql
select * from my_database.my_table
where insert_date BETWEEN '2018-07-01' AND '2018-10-01';
Теперь вы можете вызвать этот скрипт из оболочки куста: hive -f example.hql
Или вы можете создать скрипт оболочки и выполнить в нем свой запрос.run.sh
#!/bin/bash
hive -e "select * from my_database.my_table
where insert_date BETWEEN '2018-07-01' AND '2018-10-01'" >select.txt
result=`echo $?`
if [ $result -ne 0 ]; then
echo "Error!!!!"
echo "Hive error number is: $result"
exit 1
else
echo "no error, do your stuffs"
fi
Затем выполните сценарий оболочки с помощью sh run.sh
.