Будет ли sqoop удалять все существующие файлы данных? - PullRequest
0 голосов
/ 31 марта 2019

Я импортировал данные из СУБД в HDFS через sqoop с помощью следующей команды: sqoop import --connect ... --table ... --hive-import --hive-table --m 20 и т. Д. Таким образом, эта команда создаст 20 файлов под каталогом в hdfs.

Если я решупозже, чтобы импортировать другие данные и перезаписать существующие, я буду использовать следующую команду: sqoop import --connect ... --table ... --hive-import --hive-overwrite --hive-table --m 10.

Как будет вести себя sqoop ?

  1. Sqoop перейдет в каталог и удалит все предыдущие 20 файлы и создаст 10 новых.
  2. Sqool удалит все данныеиз 20 файлов, а затем записать новые данные в 10 случайных файлов из существующих 20.

1 Ответ

0 голосов
/ 31 марта 2019

Option 1

Sqoop будет просто overwrite the existing 20 files with new 10 files.

Для получения дополнительной информации см. это и это ссылки.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...