Как смоделировать таблицы размеров в TiDB? - PullRequest
0 голосов
/ 15 ноября 2018

Я хотел бы обозначить определенные таблицы, которые реплицируются во все хранилища TiKV, чтобы они всегда были доступны для локального объединения (таким образом, уменьшая дорогие распределенные объединения на уровне TiDB).Это позволило бы сопроцессору TiKV локально присоединиться к этой таблице, поскольку она всегда доступна (то есть реплицируется на каждый TiKV).В терминологии OLAP «измерения» и «факты» это таблица измерений.В этом сценарии я хотел бы осквернить факты и повторить измерения.Похоже, что TiDB рассматривает все как оскверненный факт.Можно ли это сделать?Если нет, можно ли его аппроксимировать каким-либо другим методом?Насколько пригодна кодовая база для разрешения этого типа функции?

1 Ответ

0 голосов
/ 16 ноября 2018

В настоящее время TiDB разбивает каждую таблицу на регионы и выполняет репликацию на уровне регионов.Трудно скопировать таблицу на каждый сервер TiKV, даже если он содержит только один регион.Например, в кластере TiKV есть 100 узлов, но настроенное количество реплик области равно 5.

Нам не нужно выполнять операцию соединения в сопроцессоре TiKV.Мы можем прочитать каждую таблицу измерений из TiKV, чтобы умножить узлы TiDB и связать каждый задействованный узел TiDB с частью таблицы фактов в соответствии с распределением данных таблицы фактов.Таким образом, операция соединения выполняется на уровне TiDB.

Методика, описанная выше, еще не реализована.Но это уже в нашей дорожной карте.

...