Мой вариант использования следующий:
У меня есть данные в формате JSON, которые нужно хранить в S3 в формате паркета. Пока все хорошо, я могу создать схему в Glue и присоединить «DataFormatConversionConfiguration» к моему потоку пожарных шлангов. НО данные поступают из разных «тем». Каждая тема имеет определенную «схему». Насколько я понимаю, мне придется создать несколько потоков пожарных шлангов, так как один поток может иметь только одну схему. Но у меня есть тысячи таких тем с очень высокой пропускной способностью входящих данных. Создание большого количества ресурсов пожарных рукавов не представляется возможным (https://docs.aws.amazon.com/firehose/latest/dev/limits.html)
Как мне построить трубопровод?