Я выполняю GroupByKey в конвейере, ключи - это строки, а значения - словари. Я хочу сгруппировать их и сделать обработку на них.
Я могу перейти к следующему шагу, если я удалю GroupByKey, но не с ним.
(parseout_interim | beam.Map(lambda row: (row['prefix'] + row['report_id'], row))
# | beam.GroupByKey()
| beam.ParDo(ParseSegmentsDoFn()).with_outputs(ParseSegmentsDoFn.OUTPUT_TAG_TRADELINE,
main = 'parseout'))
Если я прокомментирую GroupByKey, данные достигнут следующего шага.
Я что-то упустил полностью?
Кроме того, для sidenote - не рекомендуется ли раскручивать конвейер внутри ParDo? или это совершенно нормально? Если все в порядке, я бы ушел без использования groupbykey