вот хорошая ссылка для чтения.это объясняет DAG подробно и несколько других вещей, которые могут представлять интерес. блог базы данных на DAG
Я могу попытаться объяснить.поскольку каждый этап создается, у него есть набор задач, которые разделены.когда действие встречается.Водитель отправляет задачу исполнителям.в зависимости от того, как ваши данные разбиты на разделы, N число задач вызывается для данных в вашем распределенном кластере.поэтому стрелки, которые вы видите, - это план выполнения.как в нем не может сделать функцию карты до чтения файла.каждый узел, содержащий данные, будет выполнять эти задачи в порядке, предусмотренном группой обеспечения доступности баз данных.