Параллелизм и общий метастор Hive между двумя кластерами EMR - PullRequest
0 голосов
/ 20 сентября 2018

Каково практическое значение этого предупреждения в документации EMR?

Если вы делитесь информацией о метастазах между двумя кластерами, вы должны убедиться, что не записываете в одну и ту же таблицу метастазов одновременно, если тольковы выполняете запись в разные разделы одной и той же таблицы метастазов.

(https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-hive-metastore-external.html)

Безопасно ли иметь два кластера EMR, совместно использующих внешнюю БД метастора, если каждый из них управляет разныминаборы баз данных / таблиц Hive в metastore?

Если нет, то какой тип возможен - какой тип нарушения семантической целостности может произойти?

...