Я использую HiveServer2 (2.3.6) в Ubuntu (18.04), и запуск сервера занимает много времени (более 20 минут). Когда я просматриваю журналы запуска, то в большинстве случаев происходит синхронизация объектов Hive MetaStore с сервером Hive.
Несколько лет назад я нашел похожий пост на cloudera, где у парня была похожая проблема, но у него не было ответа [1].
Я пытался установить hive.metastore.cache.pinobjtypes
до None
(улей затем переопределил этот выбор и выделил все объекты). Я также попытался установить его на Table
, но для синхронизации c всех таблиц из базы данных все еще требуется 20 минут.
Есть ли способ удалить это локальное кэширование / синхронизацию таблиц? Я запускаю его в контейнере docker на kubernetes, поэтому модуль может быть перезапущен по желанию, и ключевым моментом является меньшее время запуска.
- https://community.cloudera.com/t5/Support-Questions/Hive-Metastore-Takes-Two-Hours-to-Start/m-p/43051