Распараллеливание в вашем конвейере происходит после преобразования ReadFromText
.Это преобразование разделяет каталоги на несколько файлов, а файлы на сегменты.
Каждый сегмент обрабатывается последовательно одним рабочим, поэтому выходные данные вашего первого преобразования FlatMap
будут последовательно переходить к другому FlatMap
-но у вас будет много экземпляров FlatMap+FlatMap
для каждого сегмента файла.
Дайте мне знать, если это ответит на ваш вопрос:)