У меня есть две таблицы в улье, которые заполняются в режиме реального времени из набора файлов. В обеих таблицах есть столбцы request_time и trx_id, где trx_id является ключом соединения.
Я хочу присоединиться к ним и поместить результат в другую таблицу (в реальном времени или почти в реальном времени). Проблема в том, как мне убедиться, что я не пропустил ни одной записи. например Что, если trx_id прибыл в одну таблицу, а не в другую?
Мое первоначальное решение состоит в том, чтобы отслеживать trx_id в другой таблице в течение определенного периода времени, который был обработан, и при объединении двух таблиц исключите записи, которые существуют в этой таблице. Однако это будет немного трудоемкий процесс. Есть предложения?