В настоящее время нет способа добавить существующий файл в hadoop, но это не то, что вы хотите сделать в любом случае. Звучит так, будто вы хотите, чтобы вывод вашей работы Map Reduce был в одном файле, что вполне возможно. Количество выходных файлов (меньше или) равно количеству редукторов, поэтому, если вы установите количество редукторов на 1, вы получите один выходной файл.
Однако прежде чем идти и делать это, подумайте, действительно ли вы этого хотите. Вы будете создавать узкое место в своем конвейере, где нужно будет передать все ваши данные через одну машину для этого сокращения. В распределенной файловой системе HDFS разница между наличием одного файла и нескольких файлов довольно прозрачна. Если вам нужен один файл за пределами кластера, лучше использовать getmerge из инструментов файловой системы.