Это зависит от того, что вам нужно сделать с файлами Parquet.
Например, если вы хотите получить их на локальный диск, то ListS3 -> FetchS3Object -> PutFile будет работать нормально.Это потому, что этот сценарий просто перемещается вокруг байтов и на самом деле не имеет значения, является ли это паркетом или нет.
Если вам нужно как-то интерпретировать данные Parquet, что звучит так, как если бы вы получалив базу данных, вам нужно использовать FetchParquet и конвертировать из Parquet в какой-нибудь другой формат, например Avro, Json или Csv, а затем отправить его на один из процессоров базы данных.
Вы можете использовать Fetch / PutПроцессоры для паркета или любые другие процессоры HDFS с s3 путем настройки core-site.xml с файловой системой s3.
http://apache -nifi-users-list.2361937.n4.nabble.com/PutParquet-with-S3-td3632.html