Среда Cloudera, мне нужно реплицировать данные из одного кластера в другой и отбрасывать все столбцы PCI, возможно ли это с опциями в одной команде hdfs distcp, например sqoop? или может ли это сделать sqoop?
Исходный формат смешанный, некоторые в паркете, некоторые в тексте. Направление, предпочитайте оригинальный формат.
Большое спасибо.