После использования TextIO.read для получения PCollection<String>
отдельных строк, возможно ли затем использовать какое-либо комбинированное преобразование в пакеты (например, группы по 25)?Таким образом, возвращаемый тип будет выглядеть примерно так: PCollection<String, List<String>>
.Похоже, что это возможно при использовании какого-то CombineFn
, но API все еще немного загадочен для меня.
В данном контексте я читаю файлы CSV (потенциально очень очень большие), анализирую+ обработка строк и превращение их в JSON, а затем вызов REST API ... но я не хочу использовать REST API для каждой строки в отдельности, поскольку REST API поддерживает несколько элементов одновременно (до 1000, поэтомуне вся партия).