Я попробовал процесс Hive,
которые генерируют частотный ранг слов из
приговоры,
Я хотел бы вывести не несколько файлов, но
один файл.
Я искал похожий вопрос на этом сайте,
Я нашел mapred.reduce.tasks = 1,
но он генерирует не один файл, а 50 файлов.
Процесс, который я попробовал, имеет 50 входных файлов и
они все gzip файл.
Как мне получить один объединенный файл?
Размер 50 входных файлов настолько велик, что
причиной может быть какой-то предел.