Question

В последнее время мы выполняем работу по записи сжатого (gzip) текстового файла в hdfs с помощью BucketingSink из Apache Flink.Однако проблема заключается в том, что всякий раз, когда происходит сбой, он генерирует файл действительной длины (для hadoop <2.7) или усекает файл (для hadoop> = 2.7).Однако gzip - это двоичный формат, и усечение не работает просто.Любые хорошие идеи могут помочь мне?Большое спасибо!

Есть идеи написать сжатый текстовый файл в hdfs от Flink BucketingSink с отказоустойчивостью?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Есть идеи написать сжатый текстовый файл в hdfs от Flink BucketingSink с отказоустойчивостью?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы