Поток данных Apache Beam / Cloud напрямую не поддерживает чтение многострочных данных Json.
Основная причина в том, что это очень трудно сделать параллельно.Как Бим узнает, где заканчивается каждая запись?Это легко для одного читателя, но очень сложно для параллельных читателей.
Лучшее решение, которое я могу порекомендовать, - преобразовать ваши данные Json в Json (NDJSON) с разделителями строк перед обработкой в Beam / Dataflow.Это может быть так же просто, как изменение выходного формата, записанного вышестоящей задачей, или может потребовать предварительной обработки.