Вы не сказали, какова структура данных, как они консолидируются, как быстро данные должны быть доступны пользователям, и насколько сложным может быть процесс консолидации.
Однако самой неотложной проблемой будет снижение скорости 5000 строк в секунду. Вам понадобится очень большая, очень быстрая машина (вероятно, кластер с осколками).
Если возможно, я бы порекомендовал записать буфер консолидации (используя хеш-таблицу в памяти, а не в СУБД), чтобы поместить консолидированные данные - даже если они были только частично консолидированы - а затем обновить их в таблицу processingData. чем пытаться заполнить его напрямую из rawData.
Действительно, я бы, вероятно, подумал о том, чтобы разделить необработанные и консолидированные данные на отдельные серверы / кластеры (механизм объединения MySQL удобен для обеспечения унифицированного представления данных).
Вы проанализировали свои запросы, чтобы увидеть, какие индексы вам действительно нужны? (подсказка - этот скрипт очень полезен для этого).