Почему бы не оставить данные в HDFS, - PullRequest
0 голосов
/ 21 января 2020

В последний день, когда я следил за моими курсами по GCP в Coursera, они упоминали и настаивали на том, чтобы мы не оставляли данные в HDFS, а вместо этого после завершения работы мы должны скопировать их и сохранить в облачном хранилище, и каждый Когда мы хотим начать работу, мы должны снова поместить данные в HDFS и повторить l oop, поэтому у меня следующие вопросы:

  1. Потеряем ли мы наши данные в HDFS, если мы обратимся? от кластера oop?
  2. Почему мы не должны оставлять данные в HDFS?
  3. Проблемы с ценами?

Спасибо

1 Ответ

1 голос
/ 21 января 2020

Плюсы и минусы облачного хранилища по сравнению с HDFS

Переход к облачному хранилищу

1. Минусы:

а. Облачное хранилище может увеличить дисперсию ввода / вывода.

b. Облачное хранилище не поддерживает добавление или усечение файлов.

c. Облачное хранилище не поддерживает POSIX.

d. Облачное хранилище может не предоставлять всю информацию о файловой системе.

e. Облачное хранилище может иметь большую задержку запроса.

2. Плюсы:

а. Более низкие затраты.

б. Отделение от вычислений и хранения.

c. Совместимость.

d. Совместимость HDFS с эквивалентной (или лучшей) производительностью.

e. Высокая доступность данных.

f. Нет накладных расходов на управление хранилищем.

г. Быстрый запуск.

ч. Безопасность Google IAM.

i. Глобальная согласованность.

...