У меня Hadoop работает в кластере, который имеет невыделенные узлы (то есть он разделяет узлы с другими приложениями / пользователями).Когда другие пользователи используют узел кластера, ему не разрешено запускать задания Hadoop на этом узле.Таким образом, возможно, что в данный момент доступно только несколько узлов, и что эти несколько узлов не имеют всех блоков данных (реплик), необходимых для работы Hadoop.
У меня также есть большое сетевое хранилище, которое используется для резервного копирования.Итак, мне интересно, есть ли способ использовать его в качестве вторичного хранилища для Hadoop.Например, если в кластере отсутствует какой-либо блок данных, Hadoop получит блок из вторичного / резервного хранилища.
Есть идеи?
Заранее спасибо!