Я уже некоторое время использую Beam, и мне хотелось бы знать, каковы ключевые концепции написания эффективных и оптимизированных конвейеров Beam.
У меня есть небольшой опыт работы с Spark, и я знаю, что мыможет предпочесть использовать reduByKey вместо groupByKey, чтобы избежать перетасовки и оптимизации сетевого трафика.
Это то же самое для Beam?
Буду признателен за некоторые советы или материалы / лучшие практики.