Hive / Impala Table - Последний доступ - как узнать неиспользуемые таблицы - PullRequest
0 голосов
/ 20 марта 2020

Я столкнулся с проблемой, которая заключается в идентификации всех неиспользуемых таблиц Hive / Impala в хранилище данных. Насколько я вижу, есть параметр LastAccessTime, который может быть информацией, которую я ищу. Тем не менее, значение всегда UNKNOWN, и это не очень полезно! Могу ли я понять, был ли доступ к таблице Hive / Impala пользователем? (под обращением я имею в виду select * from table_name)

Какие-либо предложения для некоторых инструментов, которые могут быть полезны?

Спасибо, любая помощь будет оценена!

Редактировать: с помощью оператора "show table extended like" последний доступ, по-видимому, обновляется, однако значение LAST_ACCESS_TIME в метастаборе кустов равно 0. Это не имеет никакого смысла!

...