Я бы предложил следующий подход:
a) Чтобы указать часть истории вашего процесса OLTP.Обычно это какие-то журналы над операциями.Давайте назовем это таблицей фактов.
b) Чтобы таблица фактов была разбита по времени
c) Периодически выгружать самый старый раздел из MySQL, экспортируя его в CSV и удаляя из MySQL.
e) Загружать этот файл CSV в Hive
Благодаря реализации этой схемы вы получите все данные, кроме самых последних, в улье и предотвратите рост базы данных MySQL OLTP.