Не копируйте, пусть он сидит там, где он есть. Создайте внешнюю таблицу в другой базе данных, местоположение которой указывает на местоположение данных.
USE YOUR_DATABASE;
CREATE EXTERNAL TABLE abc ... LOCATION 'hdfs://your/data';
При необходимости восстановите разделы, используя MSCK REPAIR TABLE abc;
или ALTER TABLE abc RECOVER PARTITIONS;
, если вы используете EMR.
Если вам абсолютно необходимо скопировать данные в другое место (и если вы находитесь в платном кластере EC2 Amazon, вам нужна причина для того, чтобы тратить на это деньги), используйте distcp (инструмент распределенного копирования) :
hadoop distcp hdfs://your/data hdfs://your/data2