Как скопировать конкретные данные (столбцы), используя hadoop distcp между кластерами? - PullRequest
0 голосов
/ 11 июля 2019

Среда Cloudera, мне нужно реплицировать данные из одного кластера в другой и отбрасывать все столбцы PCI, возможно ли это с опциями в одной команде hdfs distcp, например sqoop? или может ли это сделать sqoop?

Исходный формат смешанный, некоторые в паркете, некоторые в тексте. Направление, предпочитайте оригинальный формат.

Большое спасибо.

...