У меня есть коллекция записей, для простоты скажем следующее (через запятую):
A1, B1, C1
A1, B1, C1'
A1, B2, C2
Когда я передаю его через Beam как PCollection, я сопоставляю каждый объект в объект, используя ParDo. Теперь я хочу объединить их в
A1: {
B1: [C1, C1'],
B2: C2
}
Для пар ключ-значение я могу использовать GroupByKey, но что, если структура чрезвычайно вложенная, где повторяющиеся поля могут быть на каждом уровне? Есть ли какие-либо преобразования для объединения повторяющихся полей?