Я нашел скрипт на python, который извлекает все команды SQL с пользователем, вы можете расширить этот скрипт.
./hqe.py --help
usage: hqe.py [-h] [--since SINCE] [--to TO] [--logdir LOGDIR]
[--glob LOGFILE_GLOB]
[--loglevel {DEBUG,INFO,WARNING,ERROR,CRITICAL}]
Displays queries ran on Hive.
optional arguments:
-h, --help show this help message and exit
--since SINCE how far to look back. (default: 15m)
--to TO How far to look forward. (default: now)
--logdir LOGDIR Directory of hive log files. (default: /var/log/hive)
--glob LOGFILE_GLOB Shell pattern of hive logfiles inside their logdir.
(default: hiveserver2.log*)
--loglevel {DEBUG,INFO,WARNING,ERROR,CRITICAL}, -l {DEBUG,INFO,WARNING,ERROR,CRITICAL}
Log level. (default: warn)
Если пользователю, имени хоста и продолжительности известно, что они отображаются, запрос отображается стакое же форматирование, как было отправлено, включая комментарии,
Сообщение в блоге: https://thisdataguy.com/2017/06/23/extracting-queries-from-hive-logs/
Проект Github