Нужны ли мне данные / область сцены при миграции с оракула на кассандру - PullRequest
0 голосов
/ 24 октября 2018

Я пишу утилиту для переноса существующих данных Oracle Prod в cassandra для конкретного модуля проекта.

Для этого я использую spark-sql, соединитель dasastax cassandra, apache cassandra.В настоящее время я:

  1. считываю данные из таблицы оракулов и формирую фрейм данных
  2. Обрабатываю фрейм данных
  3. , загружая данные фрейма данных в базу данных Cassandra.

Хотя он отлично работает в моей среде разработки.Мой старший говорит, что он должен предоставить «область / данные этапа», откуда я могу снова запросить, если возникнут какие-либо проблемы с сетью, вместо чтения из производственной базы данных Oracle.

Мой вопрос:

  1. Зачем мне нужны данные / область рабочей области?
  2. Если необходимо, где я должен размещать свои кадры данных, прочитанные из Oracle?
  3. Если я выберу hdfs в качестве рабочей области, эти узлы будут равныВероятность сбоя в работе моих узлов Кассандры, а также проблемы с сетью также возникает.тогда какая польза от наличия данных / области этапа в моем случае?
  4. Какие еще меры предосторожности мне нужно позаботиться о моем модуле миграции?

спасибо.

...