Я импортировал данные из СУБД в HDFS через sqoop с помощью следующей команды: sqoop import --connect ... --table ... --hive-import --hive-table --m 20
и т. Д. Таким образом, эта команда создаст 20 файлов под каталогом в hdfs.
Если я решупозже, чтобы импортировать другие данные и перезаписать существующие, я буду использовать следующую команду: sqoop import --connect ... --table ... --hive-import --hive-overwrite --hive-table --m 10
.
Как будет вести себя sqoop ?
- Sqoop перейдет в каталог и удалит все предыдущие 20 файлы и создаст 10 новых.
- Sqool удалит все данныеиз 20 файлов, а затем записать новые данные в 10 случайных файлов из существующих 20.