Есть ли способ проверить успешность операции pyarrow.write_to_dataset () для s3? - PullRequest
0 голосов
/ 16 апреля 2019

Я настраиваю приемника для чтения сообщений kafka, их агрегирования небольшими партиями и помещения полученных данных в файлы секционированного паркета на S3 с использованием метода write_to_dataset из библиотеки pyarrow.

Проблемаявляется то, что я не могу понять, как проверить, был ли файл успешно загружен на S3.Если нет, то я хочу повторить операцию, пока она не будет успешной.

В исходном коде метода я вижу, что он создает имя файла путем объединения guid со строкой ".parquet".

outfile = guid() + '.parquet'

Я могу проверить наличие объекта на S3, зная его имя, но как я могу его получить?Есть ли способ как-то перегрузить метод, чтобы он возвращал имя объекта в виде строки для последующей проверки работоспособности?Или есть лучший способ сделать это без вмешательства в исходный код?

...