Я использую distcp
(для пакетных данных), чтобы получить данные из S3.
Но по данным сайта sqoop мы можем импортировать из s3 в hdfs. Я пытался, но каждый раз получаю ошибку для connection build error
:
https://sqoop.apache.org/docs/1.99.7/user/examples/S3Import.html
Так, есть кто-нибудь, кто может сказать мне, как я могу сделать это прекрасно?
Кроме того, что я могу сделать для автоматической синхронизации добавочных данных.