Apache beam В конвейере ввода / вывода есть две функции для чтения текстовых файлов: beam.io.ReadFromText()
и beam.io.ReadAllFromText()
.Тем не менее, я не могу понять разницу между ними и где использовать какой.
Обе эти функции также имеют параметр min_bundle_size
Согласно документации: https://beam.apache.org/releases/pydoc/2.9.0/apache_beam.io.textio.html
min_bundle_size
- минимальный размер пакетов, которые должны быть сгенерированыпри разбиении этого источника на связки.
Могу ли я знать, что он также функционирует.