Ввод PCollection<KV<String,String>>
Я должен записывать файлы по ключу и каждой строке в качестве значения группы KV.Для группировки по ключу у меня есть 2 варианта: 1. GroupByKey -> PCollection<KV<String, Iterable<String>>>
2. Combine.perKey.withhotKeyFanout -> PCollection, где значение String накапливает строки из всех пар.(Combine.CombineFn<String, List<String>, CustomStringObJ>)
Я могу иметь миллионы записей на ключ. Сбор данных с ключом оптимизирован с помощью Windows и Trigger, но может содержать тысячи записей на ключ.Я беспокоюсь о том, что максимальный размер String вызовет проблему, если Combine.perKey.withHotKeyFanout
используется для создания CustomStringObJ, который имеет List<String>
в качестве члена для записи в файл.
Если мы используем GroupByKey, как обрабатывать горячие клавиши