Я выполняю свою искровую работу в кластере Emr, и я использую Hive Tables в качестве источника данных, который использует каталог hdfs:///home/hadoop/database
как target-dir
для каталога базы данных.
Когда я запустил свое искровое задание, оно потеряло узел кластера и через некоторое время снова заработало.
Теперь я пытаюсь запустить чтение моих таблиц улья, и оно выдает Could not obtain block
.
Это потому, что конкретная таблица хранится в узле (узле, который иногда отключается)?
Когда узел кластера Emr не работает, будет ли он перезагружен и не будет сохранено ни одного из предыдущих данных HDFS?