Я пытаюсь записать файл паркета следующим образом в Apache Beam, используя сжатие Snappy
records.apply(FileIO.<GenericRecord>write().via(ParquetIO.sink(schema)).to(options.getOutput()));
Я вижу, что можно установить AUTO
, GZIP
, BZIP2
, ZIP
и DEFLATE
как сжатие, но я не могу найти способ установить его как SNAPPY
, есть идеи, как это сделать?Для справки можно использовать wrting to avro следующим образом:
records.apply("writeAvro", AvroIO.writeGenericRecords(schema).withCodec(CodecFactory.snappyCodec()).to(options.getOutput()));