Я пытаюсь понять метод слияния в искре.
У меня есть JavaRDD<String>
(который состоит из 16310 строк), и я хочу сохранить его в 233 файлах. (один файл с 70 строками)
Сначала я попробовал это с trainDataFeatures.repartition(233).saveAsTextFile(outputPathTrainFeatures);
Это хорошо работает, но я не хочу перетасовывать свои данные. поэтому я попробовал это с: trainDataFeatures.coalesce(233, false).saveAsTextFile(outputPathTrainFeatures);
здесь я получаю только 4 выходных файла. Не тасуется, а только 4 !!! Это действительно раздражает. Может быть, кто-то может помочь мне с этим вопросом.